VinBigdata: ‘Trái tim dữ liệu’ của Vingroup và hành trình phát triển ChatGPT 'made in Vietnam'
Chỉ sau 9 tháng ChatGPT ra mắt, đội ngũ kỹ sư VinBigdata đã làm chủ hoàn toàn mô hình ngôn ngữ lớn tiếng Việt và chính thức giới thiệu ViGPT dành cho người dùng cuối.
VinBigdata là một trong 6 công ty trong lĩnh vực công nghệ - công nghiệp của Vingroup, bên cạnh các thương hiệu khác như VinFast, VinCSS, VinAI, VinHMS, VinBrain.
Start Up này được thành lập vào năm 2021 với tiền thân là Viện Nghiên cứu Dữ liệu lớn của Tập đoàn Vingroup (thành lập tháng 8/2018). Tầm nhìn của VinBigdata là trở thành công ty trí tuệ nhân tạo và dữ liệu lớn số 1 Việt Nam, top 10 khu vực, góp phần quan trọng trong hành trình đưa Vingroup trở thành Tập đoàn Công nghệ – Công nghiệp – Thương mại, dịch vụ đẳng cấp quốc tế.
Hiện tại, công ty này tập trung vào nghiên cứu và phát triển các sản phẩm dựa trên trí tuệ nhân tạo (AI) và dữ liệu lớn (Big Data), đặc biệt trong các lĩnh vực như y tế, nhận dạng giọng nói, hình ảnh và phân tích dữ liệu. VinBigData đã và đang triển khai nhiều dự án quan trọng nhằm ứng dụng AI vào đời sống và công nghệ.
VinBigData và đứa con mang tên ViGPT - “ChatGPT phiên bản Việt”
Cuối năm 2022, VinBigData đã cho ra mắt nền tảng Trí tuệ nhân tạo đa nhận thức toàn diện VinBase, hỗ trợ doanh nghiệp Việt ứng dụng các giải pháp AI và Big Data vào hoạt động sản xuất kinh doanh.
Đây là một trong những nền tảng tiên phong tại Việt Nam đưa trợ lý ảo tới gần hơn với các doanh nghiệp, giúp nâng cao chất lượng dịch vụ và mang đến trải nghiệm tốt hơn cho khách hàng.
VinBigData ra mắt nền tảng VinBase vào cuối năm 2022 |
Với ứng dụng VinBase, doanh nghiệp có thể dễ dàng tạo lập và quản lý các trợ lý ảo trên nhiều kênh giao tiếp như: Trợ lý ảo kênh văn bản (VinBase Chatbot), Trợ lý ảo kênh tổng đài (VinBase Callbot), Trợ lý ảo toàn diện cho doanh nghiệp (VinBase Virtual Assistant - Trợ lý ảo ViVi) hay các APIs tùy chỉnh (VinBase APIs) bao gồm: Nhận dạng tiếng nói tự động (ASR), Xử lý ngôn ngữ tự nhiên (NLP), Tổng hợp giọng nói (TTS), Sinh trắc học giọng nói (Voice Biometrics) và Phân tích quan điểm (Sentiment Analysis)…
Nối tiếp thành công, ngày 21/8/2023, VinBigData đã chính thức công bố xây dựng thành công mô hình ngôn ngữ lớn (LLM, Large Language Model) tiếng Việt, đặt nền móng cho việc xây dựng các giải pháp tích hợp AI tạo sinh (Generative AI).
Theo VinBigdata, thành quả này không chỉ đưa VinBigdata trở thành đơn vị đầu tiên tại Việt Nam làm chủ công nghệ AI tạo sinh mà còn đánh dấu cho những bước phát triển đầu tiên của một “ChatGPT phiên bản Việt”.
Tại triển lãm VinFast – Vì tương lai Xanh, Giáo sư Vũ Hà Văn, Giám đốc Khoa học VinBigdata chia sẻ: “Trên thế giới đã có một số tập đoàn lớn nghiên cứu thành công và ra mắt các sản phẩm dựa trên mô hình ngôn ngữ lớn như OpenAI với ChatGPT hay Google với Bard.
Tại Việt Nam, nhận được sự đầu tư mạnh mẽ từ Tập đoàn Vingroup, VinBigdata đã xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt, tập trung giải quyết ba vấn đề cốt lõi: cải thiện tính chính xác, giảm chi phí hạ tầng tính toán một cách tối đa và đảm bảo tính bảo mật.
Thay vì cần tới khoảng 175 tỷ tham số như ChatGPT thì VinBigdata có thể tạo ra mô hình ngôn ngữ lớn với vài tỷ tham số, nhưng vẫn có khả năng sinh ra các văn bản có tính xác thực cao, tập trung vào dữ liệu của người Việt và tri thức Việt”.
Đến cuối năm 2023, chỉ sau 9 tháng ChatGPT ra mắt, đội ngũ kỹ sư VinBigdata đã làm chủ hoàn toàn mô hình ngôn ngữ lớn tiếng Việt và chính thức giới thiệu ViGPT dành cho người dùng cuối.
VinBigdata làm chủ hoàn toàn mô hình ngôn ngữ lớn tiếng Việt chỉ sau 9 tháng ChatGPT ra mắt |
Theo kết quả đánh giá từ Bộ Tiêu chuẩn đánh giá năng lực tiếng Việt (VMLU), ViGPT đạt điểm trung bình là 42,34%, đứng thứ tư chỉ sau ChatGPT (46,33%), Gemini (51,03%) và GPT 4.0 (65,53%).
Trong thời gian tới, VinBigdata sẽ tiếp tục đẩy mạnh việc phát triển các mô hình GenAI với số lượng tham số nhiều hơn (3 tỷ và 11 tỷ) để phục vụ các bài toán phức tạp cho doanh nghiệp.
Hiện tại, VinBigdata đã có 5 khách hàng và đối tác sử dụng sản phẩm ViGPT, bao gồm: Vinhomes, Vincom Retail, Vinpearl, Vinmec và VinFast.
VinBigdata và những cơ hội trước làn sóng AI tạo sinh thứ hai
Làn sóng AI tạo sinh đầu tiên đã mang đến những công cụ đột phá, thay đổi cách tiếp cận các công việc đơn giản. ChatGPT giúp chatbot trò chuyện tự nhiên. Gemini chứng minh AI có thể sáng tác thơ và nhạc. Các mô hình như Llama hỗ trợ các nhiệm vụ hàng ngày như soạn email, tạo thuyết trình và viết code, làm mờ ranh giới giữa con người và máy móc.
Các chuyên gia dự đoán làn sóng AI tiếp theo sẽ tập trung vào ứng dụng AI trong doanh nghiệp, sử dụng mô hình ngôn ngữ lớn (LLM) và dữ liệu nội bộ để phát triển các giải pháp tùy chỉnh. Làn sóng này có thể nâng cao khả năng ra quyết định của doanh nghiệp, xử lý dữ liệu lớn, phân tích xu hướng và tạo báo cáo chi tiết hỗ trợ chiến lược và hợp tác.
Theo báo cáo từ Precedence Research (2023), quy mô thị trường GenAI trong ngành tài chính – ngân hàng dự kiến đạt hơn 12 tỷ USD vào năm 2032 trên toàn cầu. Tại Việt Nam, làn sóng chuyển đổi số trong ngành ngân hàng, tài chính, bảo hiểm (BFSI) cũng đang diễn ra mạnh mẽ.
“Nhiều doanh nghiệp tài chính, ngân hàng, bảo hiểm tại Việt Nam hiện nay đang đứng trước cuộc đua chuyển đổi số nhằm tối ưu chi phí, quy trình, đảm bảo an toàn dữ liệu đồng thời gia tăng trải nghiệm khách hàng, từ đó tạo ra lợi thế cạnh tranh trên thị trường”, TS. Đào Đức Minh, Tổng Giám đốc VinBigdata chia sẻ trong sự kiện A:Invent – Innovative Finance in GenAI Era vào ngày 12/9/2024.
VinBigdata “đi tắt đón đầu” trong lĩnh vực chuyển đổi số ngành tài chính, ngân hàng, bảo hiểm |
Tuy nhiên, TS. Đào Đức Minh cũng nhấn mạnh thêm, việc số hoá hiện nay hầu hết mới dừng lại ở các tác vụ đơn lẻ như chăm sóc khách hàng, bán hàng, chưa thực sự được triển khai theo một chiến lược tổng thể và toàn diện.
Mặt khác, chi phí triển khai cũng là một trong những rào cản lớn của các doanh nghiệp. Quá trình chuyển đổi số đòi hỏi một khoản chi phí đầu tư khổng lồ, không chỉ đầu tư về mặt công nghệ, mà còn về cơ sở hạ tầng và đào tạo con người. Chính vì vậy, nhiều doanh nghiệp BFSI vẫn chưa sẵn sàng “tất tay”.
Nắm bắt được điều này, VinBigdata đã ra mắt ViFi - bộ giải pháp AI tạo sinh dành riêng cho doanh nghiệp trong lĩnh vực BFSI.
“ViFi được đào tạo trên mô hình GenAI hoàn toàn làm chủ bởi VinBigdata mà không phụ thuộc vào đơn vị nước ngoài nào, song song với đó VinBigdata cũng tuân thủ chặt chẽ các tiêu chuẩn quốc tế như NIST, iBeta, GDPR, PCI DSS, ISO 2700. Điều này giúp đảm bảo tính an toàn, bảo mật dữ liệu, tăng cường khả năng quản lý và kiểm soát dữ liệu. Đây cũng là điều mà các doanh nghiệp BFSI đặc biệt quan tâm”, Giám đốc Sản phẩm VinBigdata nhấn mạnh.
Mặt khác, bộ giải pháp cũng là chìa khóa tháo gỡ nút thắt về mặt chi phí triển khai. ViFi được đào tạo trên hệ cơ sở dữ liệu thuộc đa lĩnh vực lên tới 3.500 Terabyte cùng hệ thống hạ tầng mạnh mẽ với hàng chục cụm máy chủ, giúp các doanh nghiệp tối ưu chi phí.
>> Én Vàng Taxi trở thành đối tác độc quyền của Xanh SM tại Hải Phòng