Trung Quốc lần đầu huấn luyện thành công mô hình AI 1.600 tỷ tham số hoàn toàn bằng chip nội địa
Trong bối cảnh Trung Quốc nỗ lực giảm phụ thuộc vào công nghệ Mỹ, gã khổng lồ giao đồ ăn Meituan vừa công bố một cột mốc đáng chú ý trong lĩnh vực trí tuệ nhân tạo khi ra mắt mô hình AI được cho là lớn nhất nước này từng được huấn luyện hoàn toàn bằng phần cứng nội địa.
Ngày 30/6, Meituan chính thức mã nguồn mở LongCat 2.0, mô hình ngôn ngữ lớn (LLM) sở hữu 1.600 tỷ tham số cùng cửa sổ ngữ cảnh lên tới 1 triệu token. Quy mô này tương đương DeepSeek V4 Pro, mô hình đầu bảng mà DeepSeek ra mắt hồi tháng 4.
Điều khiến LongCat 2.0 thu hút sự chú ý không chỉ nằm ở kích thước, mà còn ở quá trình phát triển. Meituan cho biết đây là mô hình AI nghìn tỷ tham số đầu tiên trên thế giới hoàn thành toàn bộ quá trình huấn luyện và vận hành trên một cụm tính toán gồm 50.000 chip AI nội địa.

Bước tiến lớn trong cuộc đua tự chủ AI
Trước đây, phần lớn các mô hình AI hàng đầu của Trung Quốc vẫn phụ thuộc vào GPU Nvidia trong giai đoạn huấn luyện, còn chip nội địa chủ yếu được sử dụng cho suy luận (inference), tức giai đoạn mô hình đã được đào tạo và thực hiện trả lời câu hỏi của người dùng.
Theo Meituan, LongCat 2.0 đã sử dụng phần cứng trong nước cho cả hai giai đoạn quan trọng nhất là huấn luyện trước (pre training) và suy luận.
Đây được xem là bước tiến lớn bởi huấn luyện trước là công đoạn tiêu tốn năng lực tính toán khổng lồ, khi mô hình phải xử lý lượng dữ liệu khổng lồ để học các quy luật ngôn ngữ và kiến thức nền tảng.
Trong khi DeepSeek V4 Pro vẫn chủ yếu sử dụng chip nội địa cho suy luận, LongCat 2.0 được huấn luyện hoàn toàn trên các cụm siêu máy tính AI sử dụng chip chuyên dụng do Trung Quốc phát triển.
Meituan cho biết hệ thống được xây dựng trên các "siêu cụm AI ASIC" quy mô hàng chục nghìn bộ xử lý, cho thấy khả năng thực hiện huấn luyện AI ở quy mô tiên phong mà không cần dựa vào nền tảng phần cứng phương Tây.
ASIC là loại vi mạch được thiết kế riêng cho những tác vụ cụ thể, khác với các bộ xử lý đa dụng thông thường.
Dù không công khai đối tác cung cấp phần cứng, Meituan tiết lộ họ đã sử dụng thư viện giao tiếp HCCL của Huawei Technologies để tối ưu khả năng trao đổi dữ liệu giữa các chip.
HCCL được xem là phiên bản tương tự NCCL, hệ thống giao tiếp nổi tiếng của Nvidia.
Chuyên gia: Thành tựu chưa từng có
Thông báo của Meituan nhanh chóng thu hút sự chú ý của cộng đồng AI toàn cầu.
Nhà phân tích công nghệ TP Huang nhận định thành quả này đã xóa bỏ những nghi ngờ về khả năng huấn luyện các mô hình ngôn ngữ lớn trên nền tảng Atlas 950 SuperPod, hệ thống điện toán AI mà Huawei giới thiệu trong thời gian gần đây.
Trong khi đó, Hanchi Sun, nghiên cứu sinh tiến sĩ ngành khoa học máy tính tại Lehigh University, đánh giá đây là lần đầu tiên một mô hình có hiệu năng tiệm cận nhóm dẫn đầu thế giới được huấn luyện trên 50.000 bộ tăng tốc AI do Trung Quốc tự sản xuất.
Theo Meituan, LongCat 2.0 thể hiện năng lực mạnh trong lập trình và các tác vụ AI tự động.
Ở một số bài kiểm tra như Terminal Bench 2.1 và SWE Bench Pro, mô hình này thậm chí vượt qua phiên bản cũ của Gemini Pro từ Google.
Tuy nhiên, Meituan cũng thừa nhận LongCat 2.0 vẫn còn khoảng cách đáng kể so với các mô hình hàng đầu thế giới như GPT 5.5 của OpenAI hay Claude 4.8 Opus của Anthropic.
Vẫn còn khoảng cách lớn với Nvidia
Dù đạt bước đột phá quan trọng, Meituan cho biết việc thay thế hoàn toàn hệ sinh thái của Nvidia vẫn là thách thức rất lớn.
Theo báo cáo kỹ thuật đi kèm, cộng đồng phần mềm hỗ trợ chip AI nội địa hiện vẫn kém phát triển hơn đáng kể so với hệ sinh thái Nvidia vốn đã hoàn thiện sau nhiều năm.
Việc huấn luyện mô hình trên cụm hơn 50.000 chip cũng tạo ra hàng loạt thách thức về quy mô hệ thống, khả năng đồng bộ dữ liệu và quản lý bộ nhớ.
Meituan cho biết dung lượng bộ nhớ trên các bộ tăng tốc AI nội địa thấp hơn đáng kể so với chip H800 của Nvidia, dòng sản phẩm hiện bị Mỹ cấm xuất khẩu sang Trung Quốc.
Bộ nhớ chính là nút thắt lớn nhất trong toàn bộ dự án.
Để khắc phục hạn chế này, công ty phải xây dựng một hạ tầng hoàn toàn mới với hàng loạt giải pháp tối ưu nhằm đảm bảo hệ thống vận hành ổn định, an toàn và có khả năng mở rộng ở quy mô cực lớn.
Tín hiệu mới trong cuộc chiến chip AI Mỹ - Trung
Sự xuất hiện của LongCat 2.0 cho thấy Trung Quốc đang tiến thêm một bước trong nỗ lực xây dựng chuỗi công nghệ AI tự chủ giữa lúc các biện pháp kiểm soát xuất khẩu chip của Mỹ ngày càng siết chặt.
Nếu những kết quả mà Meituan công bố được các tổ chức độc lập xác nhận, đây có thể là một trong những dấu mốc quan trọng nhất của ngành bán dẫn AI Trung Quốc kể từ khi Mỹ siết chặt các lệnh hạn chế xuất khẩu chip tiên tiến.
Dù vẫn còn khoảng cách với những mô hình AI mạnh nhất thế giới, LongCat 2.0 cho thấy Bắc Kinh đang tiến gần hơn tới mục tiêu xây dựng một hệ sinh thái AI tự chủ, ít phụ thuộc vào công nghệ phương Tây hơn trước.
Theo SCMP
