OpenAI cho biết bản nâng cấp sắp tới sẽ cho ChatGPT khả năng 'nhìn, nghe và nói' khi tương tác với người dùng.
Chatbot AI sẽ có thể trao đổi bằng giọng nói và tương tác thông qua hình ảnh, một bước đi gần hơn với trợ lý ảo Siri của Apple.
Trong thông báo đăng trên blog ngày 25/9, OpenAI nói rằng tính năng hỗ trợ giọng nói 'sẽ mở ra cánh cửa sáng tạo và các ứng dụng tập trung vào khả năng tiếp cận'.
Các dịch vụ AI trợ lý ảo như Siri, Google và Alexa của Amazon được tích hợp trực tiếp trên thiết bị và thường được sử dụng để cài báo thức, đặt lịch nhắc nhở hoặc lấy thông tin từ Internet.
Kể từ khi được ra mắt vào cuối năm ngoái và trở thành ứng dụng có tốc độ tăng trưởng người dùng nhanh nhất lịch sử Internet, ChatGPT đã được các công ty áp dụng cho nhiều nhiệm vụ khác nhau, từ tóm tắt tài liệu cho đến viết code máy tính, tạo ra cuộc chạy đua giữa những gã khổng lồ công nghệ trong lĩnh vực này.
Tính năng giọng nói của ChatGPT có thể kể lại câu chuyện ru ngủ, tham gia giải quyết những thảo luận khi ăn tối hoặc đóng vai trò là “thư ký” chép lại nội dung đọc của người dùng.
OpenAI cho biết công nghệ này đang được Spotify sử dụng trên các podcast của nền tảng để dịch nội dung của họ sang nhiều ngôn ngữ khác nhau.
Trong khi đó, với tính năng hỗ trợ hình ảnh, người dùng có thể chụp ảnh mọi thứ xung quanh và yêu cầu chatbot giải quyết những vấn đề như “lò nướng không hoạt động, xem trong tủ lạnh có gì cho bữa tối”, hay thậm chí “phân tích biểu đồ dữ liệu phức tạp”.
Hiện Google Lens của Alphabet đang là ứng dụng phổ biến thu thập thông tin về hình ảnh.
Dự kiến những tính năng mới trên ChatGPT sẽ được phát hành cho những thuê bao gói Plus và Enterprise trong hai tuần tới.
(Theo Reuters)
Sam Atman nhận lương bao nhiêu trong năm 2023?
Lao đao trước làn sóng AI, giá trị một doanh nghiệp bị ‘thổi bay’ 99% vì ChatGPT