Doanh nghiệp

Viettel xây dựng thành công mô hình AI tiếng Việt 120 tỷ tham số, độ chính xác dẫn đầu khu vực

Hoàng Đan 05/06/2026 15:40

Viettel AI vừa công bố đã phát triển thành công mô hình ngôn ngữ lớn tiếng Việt quy mô 120 tỷ tham số dựa trên nền tảng của NVIDIA.

Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) vừa công bố đã phát triển thành công mô hình ngôn ngữ lớn tiếng Việt quy mô 120 tỷ tham số có tên gọi VT-Super-120B-A12B, dựa trên nền tảng của NVIDIA.

Qua các bài kiểm tra đánh giá, mô hình này được ghi nhận nằm trong nhóm dẫn đầu về độ chính xác khi so sánh với các mô hình trí tuệ nhân tạo khác có cùng quy mô trên thế giới. Về mặt kỹ thuật, một trong những rào cản lớn nhất khi huấn luyện trí tuệ nhân tạo đa ngôn ngữ là hiện tượng "quên kiến thức cũ" (catastrophic forgetting) trong quá trình tinh chỉnh. Tuy nhiên, dữ liệu kiểm tra cho thấy Viettel đã giải quyết được thách thức này, giúp mô hình tăng cường mạnh mẽ năng lực xử lý tiếng Việt mà không làm suy giảm hiệu năng tiếng Anh của mô hình gốc.

Dựa trên kiến trúc mở NVIDIA Nemotron 3 Super, mô hình của Viettel sở hữu khả năng xử lý ngữ cảnh dài. Khả năng này cho phép hệ thống duy trì mạch thông tin xuyên suốt khi phải xử lý đồng thời nhiều tài liệu, các quy trình nghiệp vụ thay đổi liên tục, cũng như những đoạn hội thoại phức tạp trong cùng một tác vụ.

Từ nền tảng này, Viettel hiện đang phát triển hệ sinh thái trợ lý ảo tự hành (AI Agent) dành riêng cho người Việt, với khả năng tự thực hiện chuỗi tác vụ trong cùng một không gian làm việc. Ứng dụng thực tiễn đầu tiên được triển khai là Trợ lý AI Pháp luật, hướng tới việc phân tích hồ sơ, đối chiếu các quy định pháp lý và đề xuất hướng xử lý dữ liệu với độ chính xác cao.

vt-super-120b-a12b duoc xay dung tren kien truc mo nvidia nemotron 3 super co kha nang xu ly ngu canh dai
VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super, có khả năng xử lý ngữ cảnh dài

Thành tựu của Viettel có sự đóng góp trực tiếp từ nền tảng phần cứng và kiến trúc của NVIDIA. Viettel là một trong những đơn vị tiên phong tại Việt Nam và khu vực Đông Nam Á đầu tư, vận hành cụm 22 hệ thống siêu máy tính NVIDIA DGX B200. Hệ thống này cung cấp năng lực tính toán hiệu năng cao bậc nhất thế giới, đạt tốc độ xử lý lên tới 1.500 triệu tỷ phép tính mỗi giây (1,5 ExaFLOPs), giúp xử lý khối lượng dữ liệu khổng lồ và rút ngắn tối đa thời gian huấn luyện mô hình.

Song song với việc triển khai hạ tầng, đội ngũ kỹ sư Viettel đã trực tiếp làm việc cùng nhóm NVIDIA Nemotron thông qua các hội thảo kỹ thuật chuyên sâu để trao đổi, tối ưu hóa phương pháp huấn luyện và tinh chỉnh mô hình. Nhờ đó, quy trình nghiên cứu được rút ngắn và nâng cao năng lực triển khai hiệu quả.

Về dữ liệu và quy trình phát triển, mô hình được xây dựng dựa trên nguồn tri thức số mang tính bản địa cao, bao gồm dữ liệu hành chính, nghiệp vụ doanh nghiệp, hệ thống văn bản chuyên ngành và hội thoại thực tế tại Việt Nam.

Quá trình huấn luyện này được thực hiện chuyên sâu qua nhiều giai đoạn nối tiếp nhau. Đầu tiên là giai đoạn tiếp tục tiền huấn luyện trên các kho dữ liệu quy mô lớn để mở rộng năng lực ngôn ngữ và tri thức tiếng Việt. Tiếp theo, mô hình được tinh chỉnh có giám sát nhằm cải thiện khả năng suy luận logic. Cuối cùng, mô hình trải qua bước học tăng cường để nâng cao độ chính xác trong các câu phản hồi và tối ưu hóa khả năng xử lý nghiệp vụ thực tế.

Theo Kiến thức Đầu tư
https://dautu.kinhtechungkhoan.vn/viettel-xay-dung-thanh-cong-mo-hinh-ai-tieng-viet-120-ty-tham-so-do-chinh-xac-dan-dau-khu-vuc-1450562.html
Đừng bỏ lỡ
    Đặc sắc
    Nổi bật Người quan sát
    Đọc tiếp
    Viettel xây dựng thành công mô hình AI tiếng Việt 120 tỷ tham số, độ chính xác dẫn đầu khu vực
    POWERED BY ONECMS & INTECH