Stanford: ChatGPT đang ngày càng “kém thông minh” hơn

Nghiên cứu của các nhà khoa học ở Đại học Stanford cho thấy, ChatGPT đang ngày càng "kém thông minh" hơn.

Một báo cáo của các nhà nghiên cứu tại Đại học Stanford và UC Berkeley, phát hiện ra rằng ChatGPT, chatbot mô hình ngôn ngữ lớn của OpenAI, đang trở nên “kém thông minh” hơn theo thời gian. Cụ thể, so với thời điểm tháng 11/2022 khi mới ra mắt, thì độ chính xác của ChatGPT trong nhiều nhiệm vụ đã giảm đáng kể, khoảng 25%.

Có thể thấy, sau 7 tháng kể từ thời điểm ra mắt, ứng dụng web phát triển nhanh nhất trong lịch sử internet ChatGPT đang gặp phải nhiều lời phàn nàn từ người dùng. Một trong số đó đến từ việc mô hình AI mới nhất đằng sau ChatGPT là GPT-4 đang dần trở nên “kém thông minh” hơn. Các nhà nghiên cứu đã thử nghiệm khả năng giải toán và nhận thấy rằng độ chính xác của ChatGPT đối với các bài toán trong tháng 6 giảm chỉ còn 2,4%, so với mức 87,5% đến 97,6% hồi tháng 3.

Tương tự, khả năng lập trình của ChatGPT vào tháng 6 cũng trở nên kém cỏi hơn nhiều, khi các dòng mã lập trình được viết ra mắc nhiều lỗi hơn so với thời điểm đầu năm nay. Cuối cùng, ChatGPT cũng “ít sẵn sàng trả lời các câu hỏi nhạy cảm hơn”. Tuy nhiên, các nhà nghiên cứu hiện không rõ tại sao hiệu suất của ChatGPT lại giảm. Họ suy đoán rằng đó có thể là do một số yếu tố, chẳng hạn như những thay đổi đối với dữ liệu đào tạo hoặc của chính thuật toán.

Kết quả của nghiên cứu làm dấy lên mối lo ngại về độ tin cậy của ChatGPT. Nếu chatbot trở nên tồi tệ hơn theo thời gian, có thể dẫn đến việc người dùng đưa ra quyết định tồi tệ dựa trên phản hồi của chatbot. OpenAI hiện vẫn chưa bình luận về những phát hiện của nghiên cứu. Tuy nhiên, công ty cam kết sẽ cải thiện độ chính xác và độ tin cậy của ChatGPT.

Hiện, thắc mắc tại sao GPT-4 lại trở nên kém cỏi như vậy là điều mà nhóm nghiên cứu vẫn chưa thể xác định. "Báo cáo không thể giải thích được vì sao sự suy giảm khả năng của GPT-4 lại xảy ra. Chúng tôi thậm chí không biết liệu OpenAI có biết điều này đang xảy ra hay không”, Giáo sư Ethan Mollick tại trường Kinh doanh Wharton của ĐH Pennsylvania cho biết.

Thế nhưng khi trả lời một nhận xét không liên quan đến nghiên cứu, Phó chủ tịch phụ trách sản phẩm của OpenAI - ông Peter Welinder viết rằng: “Chúng tôi không làm cho GPT-4 kém thông minh hơn. Ngược lại, chúng tôi đang làm cho mỗi phiên bản hiện đại hơn. Giả thuyết hiện tại: Khi bạn sử dụng nó nhiều hơn, bạn bắt đầu nhận thấy các vấn đề mà bạn chưa từng thấy trước đây”.

Bên cạnh đó, theo dữ liệu từ công ty phân tích SimilarWeb, lưu lượng truy cập toàn cầu vào trang web ChatGPT của OpenAI ước tính giảm khoảng 10% trong khoảng thời gian từ tháng 5 đến tháng 6. Đây là con số đánh dấu lần đầu tiên số lượng truy cập vào mô hình ngôn ngữ lớn này suy giảm kể từ khi ChatGPT được ra mắt hồi tháng 11 năm ngoái.

Theo đó, vào tháng 6/2023, lưu lượng truy cập trên toàn thế giới từ PC và thiết bị di động đến trang web của ChatGPt đã giảm 9,7% so với tháng trước. "ChatGPT không còn duy trì được độ nóng để có thể trở thành trang web có nhiều lượt truy cập nhất trên thế giới", theo Similarweb.

Do vậy, người dùng có lẽ nên biết về khả năng cung cấp thông tin không chính xác hoặc gây hiểu lầm của ChatGPT. Nếu sử dụng ChatGPT cho các nhiệm vụ quan trọng, người dùng nên xác minh phản hồi của chatbot với các nguồn khác.

Stanford: ChatGPT đang ngày càng “kém thông minh” hơn

AI của Vingroup đứng đầu về năng lực tiếng Việt

Chưa từng có: OpenAI đề xuất chia 5% cổ phần cho Chính phủ Mỹ, tham vọng biến AI thành tài sản của toàn dân

ChatGPT lập kỳ tích chưa từng có trong lịch sử công nghệ

ChatGPT không còn là ưu tiên số 1 của OpenAI

OpenAI chuẩn bị 'cuộc đại tu' lớn nhất lịch sử ChatGPT ngay trước thềm IPO

ChatGPT

OpenAI

Uber thâu tóm Delivery Hero với định giá 14,5 tỷ USD: Định hình lại bản đồ giao đồ ăn toàn cầu

Mở email buổi sáng, một lập trình viên chết lặng khi thấy tài khoản báo nợ gần 17 triệu USD vì sử dụng Claude API

Từng bị e ngại sẽ sớm bão hòa, thị trường bán dẫn bất ngờ nhận tin vui từ ngân hàng Trung ương Hàn Quốc

AI từng được tung hô, nay trở thành 'cái gai' của một ngành có hơn nửa tỷ 'khách hàng'

Không phải 'cha đẻ' OpenAI, đây mới là tỷ phú AI giàu nhất thế giới

Vừa lên iOS 27 vẫn không có Siri AI? Người Việt muốn dùng phải làm điều này

Đã tìm được 100 hài cốt liệt sĩ tại Công viên Lê Thị Riêng

Chuyển cơ quan công an gần 350 hồ sơ thuế có dấu hiệu vi phạm

Tổng thống Mỹ biến chung kết World Cup thành ngoại giao bóng đá

Nữ chủ tịch tập đoàn kiến nghị 'nóng' về luồng vốn xanh

Jordan đánh chặn 10 tên lửa Iran

Vùng Vịnh hứng 'mưa hoả lực' khi Mỹ - Iran leo thang hoạt động quân sự

Xét xử Nguyễn Tiến Quang SN 1988 về hành vi ném gạch vào đầu khiến chồng chủ quán massage sống thực vật

Khổ như đi bán kim cương: Tài sản tiền tỷ thành… cục đá

Đang nợ chồng chất, Novaland lấy tiền ở đâu để cho công ty con vay 2.000 tỷ đồng?

Hà Nội cưỡng chế loạt nhà bịt tôn, xây dựng 'chui'

Bắt tay đối tác Hàn Quốc, THACO của ông Trần Bá Dương mở thêm lĩnh vực kinh doanh mới tại Việt Nam

Đứng trước Thủ tướng Lê Minh Hưng, Thống đốc Phạm Đức Ấn thừa nhận điều hành lãi suất ‘vất vả’, lý giải nguyên nhân khó giảm

Đứng trước Thủ tướng Lê Minh Hưng, Chủ tịch Vietcombank báo cáo 5 'điểm nghẽn' của ngành ngân hàng

Uber thâu tóm Delivery Hero với định giá 14,5 tỷ USD: Định hình lại bản đồ giao đồ ăn toàn cầu

VinFast tiếp tục ghi dấu ấn tại quốc gia 118 triệu dân, khiến đối tác phải khẳng định ‘tự hào khi đồng hành cùng’