Trung Quốc tiếp tục gây địa chấn AI, Mỹ chỉ còn dẫn trước 4 tháng?
Khoảng cách giữa Mỹ và Trung Quốc trong cuộc đua trí tuệ nhân tạo có thể đang thu hẹp nhanh hơn dự kiến.
Khi công ty khởi nghiệp DeepSeek của Trung Quốc gây chấn động cuộc đua AI hồi tháng 1/2025 với việc ra mắt mô hình DeepSeek R1, khoảng 1.000 tỷ USD vốn hóa đã bị thổi bay khỏi thị trường chứng khoán Mỹ.
Cổ phiếu Nvidia từng mất tới 17% giá trị trong thời gian ngắn, trong khi chỉ số Nasdaq lao dốc 3,1% chỉ trong một phiên giao dịch.
Điều khiến giới đầu tư Mỹ lo ngại không chỉ là chất lượng AI của Trung Quốc, mà còn bởi các mô hình này được cung cấp miễn phí.
Tuy nhiên, làn sóng hoảng loạn nhanh chóng lắng xuống. Kể từ đó, định giá thị trường trên toàn cầu ngày càng phụ thuộc vào kỳ vọng rằng AI vừa mang tính cách mạng vừa có khả năng tạo ra lợi nhuận khổng lồ.
Giờ đây, các phòng thí nghiệm AI của Trung Quốc một lần nữa khiến đối thủ Mỹ bất an. Lần này, 2 siêu cường đang ở trong cuộc đua mới: giành quyền thống trị thị trường mô hình AI.

Mô hình Trung Quốc đang tiến sát đối thủ Mỹ
Ngày 13/6, công ty Zhipu, hay còn gọi là Z.ai, đã công bố mô hình mới nhất mang tên GLM 5.2 với tuyên bố đây là "bước tiến đưa trí tuệ tiên tiến đến gần hơn với mọi người".
Đây được xem là mô hình AI do Trung Quốc đào tạo mạnh nhất từ trước đến nay, trong khi chi phí vận hành chỉ bằng chưa tới 1/10 so với Fable 5 – mô hình mới nhất của Anthropic.
Trong khi đó, nhiều doanh nghiệp Mỹ thời gian gần đây phải đối mặt với chi phí AI tăng vọt, có trường hợp lên tới hàng nghìn USD cho mỗi nhân viên. Một số công ty thậm chí phải phân bổ ngân sách sử dụng theo số lượng token – đơn vị văn bản mà mô hình xử lý.
Ngày 12/6, chính quyền Tổng thống Donald Trump đã cấm người không mang quốc tịch Mỹ sử dụng Fable 5, buộc Anthropic phải ngừng cung cấp quyền truy cập cho toàn bộ người dùng.
Lần đầu tiên, việc tiếp cận các mô hình AI tiên tiến nhất phụ thuộc trực tiếp vào quyết định của Chính phủ Mỹ.
Điều này có thể khiến nhiều khách hàng tìm đến các lựa chọn thay thế. Đối với không ít người dùng, GLM 5.2 đủ mạnh, chi phí thấp và quan trọng hơn là nằm ngoài tầm kiểm soát của chính quyền ông Trump.
Theo công ty nghiên cứu Artificial Analysis, GLM 5.2 hiện là mô hình mã nguồn mở thông minh nhất trên thị trường. Trong bảng xếp hạng tổng thể, mô hình này đứng thứ 4, chỉ sau ChatGPT 5.5 của OpenAI và xếp trên Gemini của Google.
Sự xuất hiện của GLM 5.2 đã khiến giới công nghệ bất ngờ. Đầu năm nay, nhiều nhà phát triển Trung Quốc vẫn cho rằng phải đến trước năm 2030 họ mới có thể vượt các đối thủ Mỹ.
Sau khi Zhipu công bố sản phẩm mới, tỷ phú Elon Musk nhận định trên mạng xã hội X rằng Trung Quốc có thể bắt kịp năng lực AI tiên tiến nhất hiện nay ngay từ đầu năm tới.
Đáp lại, đồng sáng lập Zhipu, ông Tang Jie, cho rằng điều đó "sẽ không mất nhiều thời gian đến vậy".

Nhưng khác với cú sốc DeepSeek hồi đầu năm, thị trường Mỹ đến nay vẫn phản ứng khá thờ ơ với GLM 5.2.
Một phần nguyên nhân là việc đánh giá chính xác năng lực của các mô hình AI Trung Quốc ngày càng trở nên khó khăn hơn. Artificial Analysis sử dụng hàng chục bộ kiểm tra dạng thi cử để đánh giá khả năng của GLM 5.2. Xét trên các bài kiểm tra này, Anthropic vẫn giữ lợi thế. Trung bình, Fable 5 được đánh giá thông minh hơn khoảng 17% so với GLM 5.2.
Một thước đo quan trọng khác là thời gian cần thiết để đạt đến trình độ này. Mô hình phương Tây có năng lực tương đương GLM 5.2 đã xuất hiện từ tháng 2 năm nay, tức sớm hơn khoảng 4 tháng.
Trên thực tế, lợi thế của Mỹ có thể còn lớn hơn con số 4 tháng.
Bức tranh trái chiều về khoảng cách AI Mỹ - Trung
Theo ông Havard Tveit Ihle thuộc Viện Nghiên cứu Quốc phòng Na Uy, các mô hình mã nguồn mở – phần lớn đến từ Trung Quốc – thường đạt kết quả tốt hơn trên các bộ kiểm tra công khai so với các bài đánh giá bí mật.
Nguyên nhân là đề thi của các bộ kiểm tra chuẩn công khai đều được công bố rộng rãi, trong khi những tổ chức sử dụng bộ đánh giá riêng thường giữ kín nội dung.
Nghiên cứu của ông Ihle, được công bố trước khi GLM 5.2 ra mắt, chỉ ra rằng AI Trung Quốc chậm hơn Mỹ khoảng 4 - 6 tháng trên bài kiểm tra công khai.
Tuy nhiên, với các bài kiểm tra riêng, khoảng cách này tăng gần gấp đôi, lên 8 - 10 tháng.
Theo ông Ihle, các phòng thí nghiệm AI Trung Quốc dường như đang "dạy để làm bài kiểm tra", tức tối ưu mô hình nhằm đạt điểm cao trên các bài đánh giá phổ biến.
Trên 2 bài kiểm tra riêng đã được thực hiện, GLM 5.2 tiếp tục cho thấy dấu hiệu tương tự. Mô hình này chậm hơn khoảng 7 tháng trên WeirdML – bài kiểm tra đánh giá khả năng suy luận phức tạp – và tụt hậu tới 1 năm trên SimpleBench, vốn được thiết kế để đánh giá khả năng suy luận thông thường thông qua các câu hỏi đánh lừa.

Tuy vậy, xu hướng này không hoàn toàn nhất quán.
Trong một bài kiểm tra mới do Artificial Analysis công bố ngày 19/6, mô phỏng các tác vụ văn phòng như xử lý tệp hỗn độn và đánh giá thông tin mâu thuẫn, GLM 5.2 đã vượt qua ChatGPT 5.5 dù không thể được huấn luyện trước cho bài đánh giá này.
Những kết quả trên cho thấy lợi thế của Mỹ vẫn được duy trì, song khoảng cách không còn mở rộng như nhiều người từng dự đoán.
Điều đặc biệt đáng chú ý là GLM 5.2 hoạt động khá tốt trong những nhiệm vụ vốn thường gây khó khăn cho các mô hình Trung Quốc.
Các mô hình AI của Trung Quốc thường vượt trội trong những lĩnh vực có đáp án rõ ràng như toán học hay lập trình. Nhưng chúng lại gặp khó với những bài toán mở hoặc đòi hỏi khả năng phán đoán độc lập trong thời gian dài.
Điều này phản ánh một trong những thách thức lớn nhất của ngành AI Trung Quốc: các biện pháp kiểm soát xuất khẩu chip tiên tiến khiến phòng thí nghiệm trong nước thiếu hụt năng lực tính toán cần thiết để huấn luyện những mô hình mạnh nhất.
Để bù đắp, các công ty Trung Quốc tập trung nhiều hơn vào giai đoạn hậu huấn luyện (post-training), tức tinh chỉnh mô hình để xử lý các nhiệm vụ cụ thể.
Quá trình này đôi khi sử dụng dữ liệu được cho là thu thập từ các hệ thống AI Mỹ thông qua kỹ thuật gọi là "chưng cất" (distillation).
AI Trung Quốc có thực sự rẻ hơn?
DeepSeek hiện thu phí chỉ 0,87 USD cho mỗi một triệu token đầu ra của mô hình V4, trong khi Anthropic thu tới 50 USD cho cùng khối lượng xử lý trên Fable 5.
Mức giá này ngày càng hấp dẫn đối với doanh nghiệp Mỹ, nơi chi phí AI đang tăng mất kiểm soát.
Theo công ty thanh toán Ramp, số lượng doanh nghiệp Mỹ trả tiền sử dụng dịch vụ của DeepSeek đã tăng mạnh trong tháng 6. Microsoft thậm chí được cho là đang cân nhắc sử dụng mô hình của DeepSeek cho chatbot Copilot.

Tuy nhiên, giới chuyên gia lưu ý giả định quan trọng nhất – rằng AI Trung Quốc rẻ hơn – không phải lúc nào cũng đúng.
Dù ngày càng mạnh hơn, các mô hình Trung Quốc nhìn chung chưa hiệu quả bằng đối thủ Mỹ. Chúng thường cần sử dụng nhiều token hơn đáng kể để đưa ra câu trả lời.
Một nghiên cứu mới đây của Viện Công nghệ Georgia cho thấy, để hoàn thành cùng một nhiệm vụ, một mô hình DeepSeek phải sử dụng số lượng token nhiều gấp 23 lần mô hình tương đương của OpenAI mới đạt kết quả tương tự.
Vì vậy, cách so sánh phù hợp không phải là chi phí trên mỗi token mà là tổng chi phí cho toàn bộ số token cần sử dụng. Theo thước đo này, GLM 5.2 thực tế có chi phí cao hơn các hệ thống cạnh tranh của Anthropic và OpenAI trong một số bài kiểm tra về kỹ thuật phần mềm.
Độ tin cậy trở thành mặt trận cạnh tranh mới của AI
Ngoài năng lực và chi phí, độ tin cậy hiện nổi lên như tiêu chí quan trọng đối với người dùng AI.
Zhipu công bố GLM 5.2 lúc 17h21 ngày 13/6 theo giờ Bắc Kinh, chỉ một ngày sau khi chính quyền Tổng thống Trump thông báo hạn chế người nước ngoài sử dụng Fable 5.
"Chúng tôi theo đuổi chiến lược mở tối đa", ông Tang Jie tuyên bố, đồng thời chỉ trích "rào cản bên ngoài" như những hạn chế do Chính phủ Mỹ và Anthropic áp đặt
Theo ông, các biện pháp này khiến người dùng có thể bị mất quyền truy cập vào các hệ thống AI bất cứ lúc nào.
Phần lớn mô hình AI Trung Quốc được phát hành dưới dạng mã nguồn mở, cho phép người dùng tải xuống và vận hành trên phần cứng nội bộ, nằm ngoài tầm can thiệp của Chính phủ hay chính nhà phát triển.
Tuy vậy, các mô hình Trung Quốc cũng đối mặt với những hạn chế riêng. Việc thiếu hụt năng lực tính toán khiến dịch vụ thường xuyên bị gián đoạn hoặc hoạt động chậm khi lưu lượng truy cập tăng cao.
Khi cuộc đua AI ngày càng tăng tốc, các nhà quản lý trên toàn thế giới sẽ phải đối mặt với nhiều thách thức mới liên quan đến an toàn và an ninh.
Nguy cơ Chính phủ can thiệp đột ngột có thể gia tăng ở cả 2 bờ Thái Bình Dương. Việc Fable 5 đủ mạnh để khiến Nhà Trắng phải hành động cho thấy mức độ nhạy cảm ngày càng lớn của công nghệ AI tiên tiến.
Trong khi đó, việc các mô hình Trung Quốc hiện chưa phải đối mặt với rủi ro quản lý tương tự có thể là dấu hiệu rõ ràng nhất cho thấy chúng vẫn chưa bắt kịp hoàn toàn các đối thủ Mỹ.
