Mô hình ngôn ngữ lớn PhởGPT do VinAI phát triển dùng mã nguồn mở và tất cả các bên đều có thể sử dụng, kể cả phục vụ cho mục đích thương mại.
Đây là khẳng định của Tiến sĩ Bùi Hải Hưng, Tổng Giám đốc VinAI, khi trao đổi với báo chí bên lề sự kiện Ngày trí tuệ nhân tạo Việt Nam (AI Day) với chủ đề “AI – tái thiết thực tại”, được tổ chức tại TP.HCM vào ngày 5/12.
Tại AI Day 2023, Công ty VinAI đã lần đầu tiên chính thức công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt là “PhởGPT”. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hoá người Việt.
PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.
“PhởGPT” là một dự án mã nguồn mở, song hành cùng trào lưu các mô hình ngôn ngữ lớn với mã nguồn mở của thế giới như Llama của Meta hay Mistral được phát triển để cạnh tranh với ChatGPT của OpenAI.
Theo các chuyên gia, so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy, PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá. Đội ngũ phát triển đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.
Tiến sĩ Bùi Hải Hưng, Tổng Giám đốc VinAI cho biết, PhởGPT được công ty phát triển từ đầu, độc lập với hầu hết tất cả mô hình khác trên thế giới, với mô hình mã nguồn mở, tất cả cộng đồng tại Việt Nam đều có thể sử dụng được và có thể tiếp tục cải thiện nó tốt hơn.
Và một trong những mục tiêu mã nguồn mở là đặt ra nền tảng để mọi người không phải tốn công làm lại việc này, đồng thời các đơn vị có thể phát triển mô hình ngôn ngữ lớn PhởGPT lên thêm nữa, bởi chỉ với một mình VinAI thì không thể xử lý hết được tất cả các ứng dụng. Đồng thời, việc này sẽ giúp có một cộng đồng mã nguồn mở chất lượng cho mô hình ngôn ngữ lớn tiếng Việt, tạo ra một hiệu ứng rất tốt để nhiều công ty khác nhau có thể tham gia và ứng dụng vào một mảng nào đấy.
Cũng theo Tiến sĩ Bùi Hải Hưng, các mô hình ngôn ngữ lớn AI đòi hỏi rất lớn về năng lực cũng như nền tảng tính toán lớn và rất tốn kém về chi phí. Một trong những mục tiêu mà VinAI đang làm là tối ưu hoá những mô hình ngôn ngữ lớn như thế này, để tạo ra những mô hình có độ chính xác và nhỏ gọn hơn, có thể chạy được trên các nền tảng tính toán cũng nhỏ hơn, giúp giảm giá thành. Đây là một trong những trọng tâm, hướng quan trọng của VinAI và vấn đề này không chỉ ở Việt Nam mà toàn thế giới đang gặp phải, nhất là các nước Đông Nam Á.
Người Việt có thể tự hào khi thế giới có công nghệ như ChatGPT thì Việt Nam ngay lập tức cũng có công nghệ tương tự do chính mình phát triển, ở một vị thế mà hoàn toàn có thể hiểu công nghệ này như thế nào và tự phát triển công nghệ cho riêng mình. Trong thời gian qua, việc phát triển công nghệ AI ở Việt Nam là rất nhanh, theo kịp thế giới và về mô hình ngôn ngữ lớn nước ta đứng đầu Đông Nam Á, khi mô hình ngôn ngữ lớn mã nguồn mở của VinAI xuất hiện đầu tiên, sau đó mới là Singapore.
Bên cạnh đó, việc VinAI nghiên cứu và phát triển, công bố PhởGPT, sẽ đặt những nền móng đầu tiên cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiệu quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ. Trong thời gian tới, công ty sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như Y tế, Giáo dục…
Tiến sĩ Bùi Hải Hưng cho biết thêm, vì là mã nguồn mở nên VinAI không giới hạn về tính thương mại, tất cả các bên đều có thể sử dụng PhởGPT để phát triển các ứng dụng cho riêng mình, kể cả phục vụ mục đích thương mại. Đây như là một platform mà VinAI cung cấp cho cộng đồng đang phát triển các ứng dụng liên quan đến công nghệ AI ở trong nước.