Viettel AI nhận cú đúp giải thưởng tại cuộc thi về xử lý ngôn ngữ và tiếng nói

Viettel AI chiến thắng tại cuộc thi Vietnamese Language and Speech Processing (VLSP) 2023 ở 2 hạng mục: Nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói; Dịch máy Việt - Lào.

Cuộc thi Vietnamese Language and Speech Processing (VLSP) thuộc khuôn khổ Hội thảo quốc tế thường niên về Xử lý ngôn ngữ và Tiếng nói tiếng Việt do câu lạc bộ VLSP, chi hội của Hội Tin học Việt Nam tổ chức. VLSP 2023 tổ chức 10 cuộc thi về xử lý tiếng nói và xử lý văn bản, quy tụ các nhà nghiên cứu, chuyên gia và đơn vị phát triển công nghệ hàng đầu.

Dù đây đã là lần thứ 4 Viettel AI tham gia cuộc thi và đã có 3 lần chiến thắng trước đó, nhưng các kỹ sư Viettel vẫn gặp không ít khó khăn bởi những thay đổi trong cơ cấu hạng mục cuộc thi.

>> Ai sẽ là nhà vô địch trí tuệ nhân tạo tương lai?

Cụ thể, so với năm ngoái, hạng mục Nhận dạng tiếng nói và Nhận dạng cảm xúc năm nay được gộp chung thành một hạng mục. Các đội thi phải giải quyết cùng lúc hai bài toán để đảm bảo nhận dạng được cả văn bản và cảm xúc của câu nói, khối lượng công việc và độ khó đều tăng lên gấp đôi.

Tận dụng từng dữ liệu dù chất lượng thấp hay cao

Không chỉ thay đổi về cơ cấu hạng mục, đề thi năm nay còn tập trung vào hướng xây dựng mô hình từ đầu với điều kiện dữ liệu hạn chế, gồm các dữ liệu thô, chưa được gán nhãn và chất lượng thấp. Đề thi cung cấp 4 nhóm dữ liệu với chất lượng và hình thức khác nhau. Có dữ liệu chỉ gồm âm thanh không nhãn, có dữ liệu chỉ gồm âm thanh và văn bản, có dữ liệu gồm cảm xúc và âm thanh, chất lượng cao, nhãn chuẩn, và có bộ dữ liệu gồm cảm xúc và âm thanh, chất lượng thấp. Mỗi bộ dữ liệu được xác định rõ phục vụ theo từng mục đích và hạng mục thi, tổng số hơn 300 giờ trên tất cả các bộ dữ liệu. Đây là con số khá khiêm tốn nếu so với các bộ dữ liệu chuẩn để huấn luyện Nhận dạng tiếng nói, thông thường cần lên tới 1.000-2.000 giờ hoặc hơn.

Mỗi đội thi chỉ có chưa đầy 2 tháng để làm và nộp bài, nhưng trên thực tế, thời gian thực sự để dành cho nghiên cứu giải pháp ít hơn rất nhiều vì thiếu nguồn lực.

“Năm nay, Viettel AI dành rất nhiều nguồn lực về hạ tầng tính toán để nghiên cứu công nghệ mới cũng như phát triển sản phẩm, trong khi nhận dạng tiếng nói là một công nghệ yêu cầu tài nguyên phần cứng rất lớn”, anh Đặng Đình Sơn - Kỹ sư Trí tuệ nhân tạo, Khối Nền tảng Trợ lý ảo, Viettel AI chia sẻ.

anh 1.jpg — Nhóm Kỹ sư Trí tuệ nhân tạo, Khối Nền tảng Trợ lý ảo, đại diện Viettel AI tham gia hạng mục Nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói - VLSP 2023

Trước điều kiện dữ liệu với khối lượng và chất lượng đều thấp, nhóm nghiên cứu ngay lập tức xác định quan điểm “phải tận dụng tất cả các dữ liệu dù chất lượng thấp hay cao”. Để làm được điều này, cần xây dựng được chu trình huấn luyện xử lý toàn bộ dữ liệu cũng như chỉ một mô hình giải quyết được nhiều bài toán khác nhau thay vì nhiều mô hình.

Thành quả từ việc tiên phong làm chủ công nghệ

Trong bối cảnh vừa thiếu dữ liệu, vừa thiếu tài nguyên, nhóm nghiên cứu quyết định xây dựng một quy trình xử lý đơn giản, không đồ sộ nhưng quan trọng là được tinh chỉnh từng chi tiết nhỏ nhất.

Các kỹ sư Viettel AI tìm hiểu kỹ lưỡng các nghiên cứu mới nhất từ các hội nghị và tạp chí hàng đầu trên toàn thế giới để tìm ra hướng tiếp cận. Kết hợp với những phương pháp xử lý dữ liệu để huấn luyên mô hình đã có hiệu quả, nhóm nghiên cứu xây dựng một chu trình huấn luyện giúp xử lý toàn bộ các dữ liệu đang có. Chu trình gồm 3 bước: xây dựng mô hình tiền huấn luyện (pretraining) để mô tả đặc trưng giọng nói mà không cần nhãn, tinh chỉnh từ mô hình tiền huấn luyện cho hai bài toán nhận dạng giọng nói và nhận dạng cảm xúc, và suy luận.

“Kinh nghiệm từ việc giải quyết các bài toán thiếu dữ liệu trong quá trình phát triển, triển khai sản phẩm trước đây cũng đóng góp không nhỏ giúp đội thi tìm ra được phương pháp quyết định. Ngược lại, các kiến thức, kết quả có được từ bài thi cũng có tiềm năng áp dụng ngay cho các sản phẩm của Viettel AI, nên quá trình vừa làm việc vừa làm bài thi diễn ra khá thuận lợi”, anh Bùi Tiến Đạt - Kỹ sư Khối Nền tảng Trợ lý ảo, Viettel AI chia sẻ.

Kết quả, Viettel AI không chỉ giành giải Nhất ở hạng mục Nhận dạng tiếng nói và nhận dạng cảm xúc tiếng nói mà còn đạt được điểm số ấn tượng là 89,18% (các đội tiếp theo lần lượt là 83,40% và 78,45%).

Anh Sơn cho biết yếu tố then chốt nằm ở mô hình xử lý tiếng nói dành riêng cho tiếng Việt mà Viettel AI đã phát triển từ lâu.

“Thay vì sử dụng mô hình, hướng dẫn từ các kết quả nghiên cứu có sẵn, Viettel AI lựa chọn xây dựng và tự phát triển một mô hình riêng dành cho xử lý tiếng nói tiếng Việt. Mô hình này liên tục được cập nhật, tối ưu và càng ngày càng trở nên hiệu quả”, anh Sơn cho hay.

Không chỉ dừng lại ở khuôn khổ cuộc thi, giải pháp này của Viettel AI sẽ là tiền đề nâng cấp các sản phẩm tổng đài ảo, trợ lý ảo Viettel, giúp nhận dạng cảm xúc của khách hàng chính xác hơn trong cuộc hội thoại, từ đó đưa ra những phản hồi hay lựa chọn sắc thái câu nói phù hợp. Như vậy, các cuộc hội thoại giữa con người và AI sẽ trở nên tự nhiên hơn, cải thiện trải nghiệm người dùng. Nhiều ứng dụng mới trong việc chăm sóc khách hàng cũng được mở ra như xây dựng hệ thống tự động nhận diện các cuộc gọi phàn nàn, khiếu nại của khách hàng lên tổng đài nhằm xử lý kịp thời hay để khai thác thông tin.

anh 2.jpg — Anh Bùi Tiến Đạt - Kỹ sư Khối nền tảng Trợ lý ảo, Viettel AI đại diện đội thi trình bày kết quả nghiên cứu tại buổi hội thảo

Đại diện đơn vị cho biết, Viettel AI sẽ tiếp tục phát triển công nghệ, không ngừng nâng cấp sản phẩm để tăng mức độ chính xác, nâng cao trải nghiệm người dùng và hiệu quả của sản phẩm.

Quốc Tuấn

>> Trung Quốc trình làng mẫu bo mạch chủ nội địa 100% đầu tiên

Viettel AI nhận cú đúp giải thưởng tại cuộc thi về xử lý ngôn ngữ và tiếng nói

AI của Vingroup đứng đầu về năng lực tiếng Việt

Vợ của 'ông hoàng nhạc đỏ' nổi tiếng Việt Nam qua đời

Đời tư của ca sĩ Tăng Nhật Tuệ trước khi bị bắt: Từng bị học trò cũ tố gạ tình, hành hung, khán giả quay lưng vì phát ngôn gây 'sốc'

Đạo diễn nổi tiếng Việt Nam sắp hầu tòa

Nhà văn nắm kỷ lục đặc biệt của văn học Việt Nam: Có tác phẩm được đưa vào giáo trình ĐH nước ngoài, phim chuyển thể từ sách thu hơn 180 tỷ, U80 vẫn ra sách đều đặn

tiếng Việt

viettel

AI

Uber thâu tóm Delivery Hero với định giá 14,5 tỷ USD: Định hình lại bản đồ giao đồ ăn toàn cầu

Mở email buổi sáng, một lập trình viên chết lặng khi thấy tài khoản báo nợ gần 17 triệu USD vì sử dụng Claude API

Từng bị e ngại sẽ sớm bão hòa, thị trường bán dẫn bất ngờ nhận tin vui từ ngân hàng Trung ương Hàn Quốc

AI từng được tung hô, nay trở thành 'cái gai' của một ngành có hơn nửa tỷ 'khách hàng'

Không phải 'cha đẻ' OpenAI, đây mới là tỷ phú AI giàu nhất thế giới

Vừa lên iOS 27 vẫn không có Siri AI? Người Việt muốn dùng phải làm điều này

Trọng tài bị bắt vì ‘bữa tiệc thác loạn ma túy’ sẽ điều hành trận chung kết World Cup 2026: Messi và Argentina lo sốt vó, Tây Ban Nha mừng thầm

Công ty 2 tháng tuổi của con trai ông Phạm Nhật Vượng tăng vốn lên hơn 9.000 tỷ đồng

Sản lượng bán điện gia tăng, Nhiệt điện Phả Lại (PPC) báo lãi quý II tăng gấp 11 lần

Đề xuất miễn học phí, hỗ trợ BHYT cho gia đình sinh hai con gái: Điều kiện là gì, những địa phương nào được nhận?

Giáo sư vừa được đặt tên cho một tuyến phố ở Hà Nội: Nhà di truyền học nổi tiếng, được truy tặng Anh hùng Lao động thời kỳ đổi mới

Bùng nổ tại Indonesia: VinFast vận hành cùng lúc 20 đại lý, tăng tốc phủ xanh hệ sinh thái

Từ nay, đất thực tế rộng hơn sổ đỏ có được cấp Giấy chứng nhận cho phần diện tích tăng thêm hay không?

Khoang lái Toyota Innova Cross 2027 lộ ảnh chạy thử: Điểm thay đổi khiến đối thủ đứng ngồi không yên

Chuyển gần 3 ha rừng phòng hộ làm công viên biển đầu tiên ở Huế

Thêm 1 doanh nghiệp kim cương bất ngờ thông báo tạm ngừng hoạt động do 'biến động thị trường quá lớn'

Bộ Nội vụ hướng dẫn giải quyết chính sách cho người hoạt động không chuyên trách nghỉ việc do sáp nhập

Lần đầu tiên sau 13 năm Nga không còn tàu chiến nào ở Địa Trung Hải

Xoay 90 độ công trình thép dài 112m nặng 1.600 tấn rồi đẩy vào đúng vị trí, dự án đường sắt cao tốc về đích sớm 4 ngày

Trung Quốc thay đổi chính sách, ông lớn vật liệu xây dựng Việt Nam lập tức báo lãi quý cao kỷ lục

Lãi suất ngân hàng ngày 19/7: Top 1 lên tới 10%, ACB dẫn đầu kỳ hạn 12 tháng