Startup Trung Quốc 'đảo chính' trong thế giới AI, vượt mặt loạt ông lớn Microsoft, Google và Meta
Mô hình AI R1 do startup Trung Quốc DeepSeek phát triển được Nvidia coi là “tiến bộ AI xuất sắc”.
R1, mô hình suy luận nguồn mở của DeepSeek, được đánh giá là vượt trội so với các mô hình của những ông lớn như Microsoft, Google và Meta. Điều đáng ngạc nhiên là chi phí đào tạo R1 chỉ rơi vào khoảng 6 triệu USD, rất thấp so với hàng tỷ USD đã được các gã khổng lồ đổ vào những mô hình AI của họ.
Theo DeepSeek, đột phá này có được nhờ kỹ thuật Test Time Scaling (TTS), cho phép mô hình AI tăng thời gian "suy luận" để cải thiện chất lượng đầu ra. Nvidia, đơn vị tiên phong trong linh kiện GPU, đã đánh giá rất cao tiềm năng của Test Time Scaling. Chia sẻ với CNBC, người phát ngôn của Nvidia cho rằng một mô hình dành nhiều thời gian hơn để suy luận trong quá trình dự đoán hoặc tạo nội dung, nó sẽ cung cấp đầu ra tốt hơn.
R1 của DeepSeek vượt trội so với các mô hình AI của nhiều ông lớn trong ngành. Ảnh minh họa |
Sự ra mắt R1 đã ngay lập tức gây chấn động thị trường tài chính. Ngày 27/1, giá cổ phiếu Nvidia giảm 17%, đánh dấu thiệt hại 600 tỷ USD vốn hóa thị trường của hãng – một con số được xem là cao nhất trong lịch sử doanh nghiệp Mỹ.
Bên cạnh đó, DeepSeek cũng nhận được sự khen ngợi từ Yann LeCun, nhà khoa học trưởng về AI của Meta. Trên nền tảng Threads, ông viết: “Họ đã chứng minh các mô hình nguồn mở đang vượt qua mô hình độc quyền. Khi công trình được công khai, mọi người đều có thể hưởng lợi”.
Các nhà phân tích còn đặt ra câu hỏi về chi phí khổng lồ mà các gã khổng lồ như Microsoft, Google và Meta đã đổ vào hạ tầng AI. Liệu chi phí đó có hợp lý hay không khi DeepSeek đạt được tiến bộ AI vượt trội với chi phí thấp hơn nhiều.
Thực tế, chi phí đầu tư cho hạ tầng AI đang tăng lên nhanh chóng. Microsoft và Meta dự kiến chi tiêu tổng cộng hơn 140 tỷ USD chỉ trong năm 2025.
>>CEO OpenAI Sam Altman lên tiếng ca ngợi ‘AI giá rẻ’ DeepSeek