DeepSeek âm thầm tung ‘vũ khí’ mới giá rẻ, đối đầu trực diện GPT-5
Khác với các màn ra mắt rầm rộ, DeepSeek lặng lẽ công bố V3.1 trên nhóm WeChat và nền tảng mã nguồn mở Hugging Face.
Tháng 1 vừa qua, DeepSeek đã gây chấn động khi giới thiệu R1, mô hình AI được đánh giá ngang ngửa các LLM hàng đầu của OpenAI và Anthropic, nhưng chi phí phát triển chỉ bằng một phần nhỏ và đặc biệt được phát hành miễn phí.
Giờ đây, chỉ hai tuần sau khi OpenAI tung ra GPT-5, DeepSeek tiếp tục “đáp trả” với bản nâng cấp V3.1, mà theo giới chuyên môn, có thể sánh với GPT-5 ở một số tiêu chuẩn và được định giá chiến lược để cạnh tranh trực tiếp.

Khác với các màn ra mắt rầm rộ, DeepSeek lặng lẽ công bố V3.1 trên nhóm WeChat và nền tảng mã nguồn mở Hugging Face. Tuy âm thầm, nhưng động thái này chạm đến nhiều vấn đề nóng của ngành AI: Trung Quốc đang tăng tốc xây dựng, triển khai và kiểm soát các hệ thống AI tiên tiến mà không phụ thuộc vào công nghệ ngoại. V3.1 còn được tinh chỉnh để hoạt động tối ưu trên chip “cây nhà lá vườn”, chuẩn bị cho thế hệ chip nội địa sắp ra mắt.
Dù các công ty Mỹ còn dè dặt, mô hình DeepSeek lại được đón nhận rộng rãi tại Trung Quốc và nhiều nơi khác. Một số doanh nghiệp Mỹ thậm chí đã phát triển ứng dụng dựa trên R1. Tuy vậy, các nhà nghiên cứu cảnh báo, đầu ra của các mô hình này thường bám sát các quan điểm chính thống tại Trung Quốc, đặt ra câu hỏi về tính trung lập và độ tin cậy.
DeepSeek chỉ là một mảnh ghép trong “cuộc đua AI” của Trung Quốc, bên cạnh Qwen của Alibaba, Kimi của Moonshot AI hay Ernie của Baidu. Việc ra mắt V3.1 ngay sau khi GPT-5 gây thất vọng so với kỳ vọng thị trường được coi là tín hiệu thể hiện Bắc Kinh quyết tâm bám đuổi, thậm chí vượt mặt các phòng thí nghiệm hàng đầu Mỹ.
Sam Altman, CEO OpenAI, cũng thừa nhận sự cạnh tranh từ DeepSeek và các mô hình nguồn mở Trung Quốc là một trong những lý do OpenAI phải tung ra mô hình mã nguồn mở cách đây hai tuần.
“Nếu chúng tôi không làm, thế giới sẽ chủ yếu dựa vào các mô hình nguồn mở của Trung Quốc, Altman nói. “Đó là yếu tố lớn trong quyết định của chúng tôi”.
Cuộc chiến công nghệ Mỹ – Trung leo thang
Cạnh tranh AI song song với căng thẳng thương mại. Tuần trước, Mỹ cho phép Nvidia và AMD xuất khẩu chip AI bản giới hạn cho Trung Quốc, với điều kiện phải trích 15% doanh thu từ hoạt động này cho Washington. Đáp trả, Bắc Kinh hạn chế mua chip Nvidia, sau khi Bộ trưởng Thương mại Mỹ tuyên bố trên CNBC rằng Mỹ “không bán cho họ hàng tốt nhất, thậm chí không phải hàng hạng ba”.
Việc tối ưu DeepSeek cho chip nội địa được coi là lời khẳng định chống chọi các biện pháp kiểm soát xuất khẩu của Mỹ. Trên WeChat, DeepSeek nhấn mạnh mô hình mới được thiết kế cho “thế hệ chip nội địa sắp ra mắt”.
Altman cảnh báo: “Tôi lo ngại Mỹ đang đánh giá thấp sự tiến bộ AI của Trung Quốc. Chỉ trông chờ vào lệnh cấm xuất khẩu là không đủ”.
Điểm đáng chú ý của V3.1 nằm ở kiến trúc mới giúp mô hình vừa mạnh vừa tiết kiệm chi phí vận hành. Với 685 tỷ tham số, V3.1 áp dụng thiết kế “mixture-of-experts”, chỉ kích hoạt một phần khi xử lý câu hỏi, giảm đáng kể chi phí tính toán. Ngoài ra, V3.1 kết hợp khả năng trả lời nhanh dựa trên dữ liệu huấn luyện với tư duy lập luận từng bước, so với việc phải tách thành hai mô hình riêng biệt trước đây.
Đây là tính năng mà GPT-5 hay các model mới nhất của Anthropic, Google đã có, nhưng hiếm khi xuất hiện ở các mô hình nguồn mở. “Kiến trúc lai này là điểm sáng lớn nhất”, chuyên gia Ben Dickson nhận định.
Dù không phải bước nhảy vọt như R1 hồi tháng 1, V3.1 vẫn được đánh giá là cải tiến ấn tượng. William Falcon, CEO nền tảng Lightning AI, nhận xét: “Thật đáng nể khi họ liên tục đạt tiến bộ không hề nhỏ”. Tuy vậy, ông lưu ý DeepSeek khó triển khai vào sản xuất hơn OpenAI.
Tất cả cho thấy, AI ngày càng trở thành một phần trong “cuộc chiến công nghệ lạnh” Mỹ - Trung. Nếu các công ty Trung Quốc thực sự xây được mô hình mạnh với chi phí rẻ hơn nhiều, các đối thủ Mỹ có lý do để lo lắng về cuộc đua phía trước.
Theo Fortune