Nvidia giúp DeepSeek mạnh hơn
CEO Jensen Huang tuyên bố các sản phẩm mới của Nvidia có thể tăng cường đáng kể hiệu suất mô hình R1 của DeepSeek, trong một thông điệp nhấn mạnh vị thế vững vàng của công ty trong kỷ nguyên trí tuệ nhân tạo, cũng như trong cuộc chạy đua công nghệ giữa Mỹ và Trung Quốc.
Tại hội nghị GTC thường niên tổ chức hôm nay ở San Jose, California, Huang giải thích cách các sản phẩm mới nhất của Nvidia có thể tăng cường đáng kể khả năng suy luận cho các mô hình lớn như R1 của DeepSeek.

CEO mô tả Dynamo, phần mềm suy luận mã nguồn mở mới của công ty, là “hệ điều hành của một nhà máy AI”. Dynamo, hiện có trên Github, có thể mang lại hiệu suất cao hơn tới 30 lần trên các đơn vị xử lý đồ họa (GPU) và kiến trúc hiện có cho các tác vụ suy luận AI.
Vai trò chủ đạo của Nvidia với tư cách là “nhà cung cấp vũ khí” độc nhất trong cuộc chiến AI toàn cầu đã bị hoài nghi vào tháng 1, khi DeepSeek có trụ sở tại Hàng Châu công bố các mẫu mô hình hiệu suất cao, giá rẻ, làm dấy lên câu hỏi về việc chip AI đắt tiền liệu có bị thổi phồng.
Nvidia, công ty không được phép bán chip tiên tiến cho Trung Quốc do các hạn chế xuất khẩu của Mỹ, đã cải biến các con chip của mình để tiếp tục cung cấp cho thị trường tỷ dân, gián tiếp mang lại sự đột phá cho Deepseek.
Trong khi mô hình nguồn mở của DeepSeek bị hoài nghi trong bối cảnh căng thẳng chính trị gia tăng giữa Bắc Kinh và Washington, các nhà sản xuất chip của Mỹ, bao gồm Nvidia và AMD, đã nhanh chóng hỗ trợ các mô hình phổ biến của công ty khởi nghiệp này.
Một blog gần đây của Nvidia nêu chi tiết hệ thống Nvidia DGX duy nhất được trang bị tám GPU Blackwell của hãng có thể cung cấp tốc độ suy luận là 253 token mỗi giây cho mỗi người dùng hoặc đạt thông lượng tối đa hơn 30.000 token mỗi giây trên mô hình DeepSeek-R1 có 671 tỷ tham số. Kể từ tháng 1, nhóm của Nvidia đã cải thiện thông lượng cho mô hình R1 khoảng 36 lần.
Tại GTC năm nay, Huang trình chiếu một video so sánh mô hình ngôn ngữ truyền thống của Meta Platform với DeepSeek-R1. Mặc dù mô hình của Meta chỉ sử dụng 439 token nhưng không thể đưa ra câu trả lời đúng. R1 sử dụng 8.559 token nhưng cuối cùng đã đưa ra câu trả lời đúng sau khi khám phá nhiều tình huống và khả năng.

Người đứng đầu Nvidia cũng công bố các con chip mới đáng chú ý, bao gồm Blackwell Ultra GPU, được tối ưu hóa đặc biệt cho các mô hình lý luận và dự kiến sẽ xuất xưởng vào cuối năm nay.
Huang cũng trình bày kiến trúc GPU Vera Rubin, bộ xử lý thế hệ tiếp theo của Nvidia dự kiến phát hành vào năm 2026 và tiết lộ kiến trúc Feynman dự kiến ra mắt vào năm 2028. Các bản cập nhật khác bao gồm tiến trình nghiên cứu về robot và điện toán lượng tử.
Thời đại của robot
Mở đầu bài phát biểu trước đám đông hàng nghìn người trong hội nghị phát triển trí tuệ nhân tạo, tỷ phú Jensen Huang nói AI đang trải qua “một bước ngoặt”.
Trong bài nói chuyện kéo dài hơn hai giờ, Huang phác thảo “tiến trình phi thường” mà AI đạt được. Ông cho biết, trong 10 năm, AI đã phát triển từ nhận thức và “tầm nhìn máy tính” lên AI tạo sinh, và giờ là AI tác nhân — hay AI có khả năng lý luận.
“AI hiểu được bối cảnh, hiểu được những gì chúng ta đang yêu cầu. Hiểu được ý nghĩa mỗi yêu cầu”, ông nói. “Giờ đây, nó tạo ra câu trả lời. Về cơ bản đã thay đổi cách thức tính toán”.
Ông cho biết làn sóng AI tiếp theo đã và đang diễn ra: robot.
Ông cho biết robot được thúc đẩy bởi cái gọi là “AI vật lý” có thể hiểu được các khái niệm như ma sát và quán tính, nguyên nhân và kết quả, và tính bền vững của vật thể.
Huang cho biết: “Mỗi giai đoạn, mỗi đợt sóng đều mở ra những cơ hội thị trường mới cho tất cả chúng tôi”.

Chìa khóa cho AI vật lý là khái niệm sử dụng dữ liệu tổng hợp — từ AI hoặc dữ liệu do máy tính tạo ra — để đào tạo mô hình. Ông cho biết AI cần những trải nghiệm kỹ thuật số để học hỏi, và nó học với tốc độ khiến việc sử dụng con người trong các vòng đào tạo trở nên lỗi thời.
“Chúng ta chỉ có thể thực hiện được một lượng dữ liệu và một lượng minh họa của con người nhất định”, ông nói. “Đây là bước đột phá lớn trong vài năm trở lại đây: học tăng cường”.
Ông cho biết công nghệ của Nvidia có thể hỗ trợ loại hình học tập này cho AI khi cố gắng giải quyết vấn đề theo từng bước.
Để đạt được mục đích đó, Huang công bố Isaac GR00T N1, mô hình nền tảng nguồn mở được thiết kế để hỗ trợ phát triển robot hình người. Isaac GR00T N1 sẽ được ghép nối với mô hình AI Cosmos đã cập nhật để giúp phát triển dữ liệu đào tạo mô phỏng cho robot.
Cuối bài nói chuyện, Huang giới thiệu một công cụ vật lý nguồn mở dùng cho mô phỏng robot có tên là Newton, hiện đang được phát triển cùng Google DeepMind và Disney Research.
Một con rô-bốt nhỏ hình hộp tên là Blue đã tham gia cùng ông trên sân khấu, nhô ra từ một cái cửa sập trên sàn. Nó kêu bíp bíp với Huang và làm theo lệnh của ông.
“Thời đại của robot tổng quát đã đến rồi”, Huang nói.
Công nghệ | Tổng hợp tin tức Công nghệ mới nhất trong ngày
Trả lời
Bạn phải đăng nhập để gửi phản hồi.