Theo OpenAI, GPT-4 - bản tiếp theo GPT-3.5 trong ChatGPT - có thể lập tức đỗ đại học mà không cần luyện thi, thậm chí có thể vượt qua 90% kỳ thi sát hạch luật sư.
OpenAI ngày 14/3 đã chính thức phát hành GPT-4, một mô hình ngôn ngữ được nâng cấp so với phiên bản ChatGPT cũng do công ty khởi nghiệp của Mỹ này phát triển trước đó.
ChatGPT là một chatbot mà bất kỳ ai cũng có thể sử dụng để tạo các câu chuyện, bài báo và các dạng văn bản khác. Bản cập nhật GPT-4 cũng mang đến khả năng này, nhưng cải tiến về nhiều phương diện như độ chính xác, tính an toàn, ít bị chệch hướng và đặc biệt là khả năng xử lý đa phương thức đầu vào, trong đó có thể sử dụng đầu vào là hình ảnh để xuất ra văn bản.
Thông báo của OpenAI nhấn mạnh GPT-4 là “cột mốc mới nhất trong nỗ lực mở rộng quy mô học sâu” và đã "thể hiện hiệu suất ở cấp độ con người" đối với một số nhiệm vụ về chuyên môn và học thuật.
Công ty này khẳng định mô hình mới "sáng tạo và hợp tác hơn bao giờ hết," đồng thời sẽ "giải quyết các vấn đề khó khăn với độ chính xác cao hơn" so với các phiên bản trước đó.
GPT-4 có hàng loạt "siêu năng lực" - các chức năng mà các hệ thống AI hiện chưa thể đạt được. Ví dụ, GPT-4 được có thể đạt 1.410 điểm trong kỳ thi SAT - một trong những kỳ thi chuẩn hóa cho việc đăng ký vào một số đại học tại Mỹ; đạt mức 4 hoặc 5 trong thang điểm 5 của các kỳ thi nâng cao (AP) ở các bộ môn Lịch sử Nghệ thuật, Sinh học, Giải tích và Hóa học - số điểm đủ cao để nhận được tín chỉ đại học.
AI mới đã đánh bại 90% số người tham gia để vượt qua kỳ thi sát hạch trở thành luật sư, đánh bại 99% học sinh thi Olympic Sinh học. Nó cũng đạt điểm cao nhất trong 34 bài kiểm tra khác nhau trong các lĩnh vực như kinh tế vĩ mô, viết bài, toán học hay thậm chí nội dung về nghiên cứu rượu vang. Theo OpenAI, GPT-4 thể hiện hiệu suất ở cấp độ con người trong phần lớn kỳ thi học thuật và chuyên nghiệp
GPT-4 có thể xem và hiểu hình ảnh
Thay đổi đáng chú ý nhất đối với hệ thống máy học linh hoạt này của OpenAI là nó đã trở nên “đa phương thức”, nghĩa là nó có thể hiểu nhiều hơn một “phương thức” thông tin. ChatGPT và GPT-3 bị giới hạn ở văn bản. Chúng có thể đọc và viết nhưng chỉ có thế mà thôi.
Tuy nhiên, GPT-4 có thể nhận biết hình ảnh và nó sẽ xử lý chúng để tìm thông tin liên quan. Tất nhiên, bạn có thể yêu cầu nó mô tả những gì xuất hiện trong một bức tranh, nhưng quan trọng hơn là sự hiểu biết của nó vượt xa điều đó.
Nhưng không dừng lại ở đó, với sự hợp tác cùng Be My Eyes - một ứng dụng được sử dụng bởi những người mù và thị lực kém - công nghệ này sẽ cho phép các tình nguyện viên mô tả những gì điện thoại của họ nhìn thấy. Nó cũng mở ra một tương lai tươi sáng hơn cho các ứng dụng liên quan.
GPT-4 có bộ nhớ dài hơn
Những mô hình ngôn ngữ lớn được đào tạo trên hàng triệu dữ liệu là các trang web, sách và dữ liệu văn bản khác. Nhưng khi chúng thực sự trò chuyện với người dùng, sẽ có các giới hạn về mức độ nội dung mà hệ thống có thể “ghi nhớ”.
Giới hạn đó với GPT-3.5 và phiên bản cũ của ChatGPT là 4.096 “mã thông báo”, tức là khoảng 8.000 từ hoặc khoảng 4 đến 5 trang sách. Vì vậy, nó sẽ gần như đánh mất dấu vết của mọi thứ sau khi đã chúng đi quá xa và khiến mức độ chú ý giảm xuống.
Nhưng GPT-4 có số lượng mã thông báo tối đa là 32.768. Điều đó có nghĩa là khoảng 64.000 từ hoặc 50 trang văn bản, đủ cho toàn bộ một vở kịch hoặc truyện ngắn.
GPT-4 đa ngôn ngữ hơn
Thế giới AI bị chi phối bởi những người nói tiếng Anh và mọi thứ từ dữ liệu, các thử nghiệm đến tài liệu nghiên cứu đều bằng ngôn ngữ này. Nhưng khả năng của các mô hình ngôn ngữ lớn cho phép chúng có thể áp dụng được trong bất kỳ ngôn ngữ viết nào.
GPT-4 đã tiến thêm một bước để thực hiện điều này bằng cách chứng minh rằng nó có thể trả lời hàng nghìn câu hỏi trắc nghiệm với độ chính xác cao trên 26 ngôn ngữ, từ tiếng Ý, tiếng Ukraina đến tiếng Hàn.
Thử nghiệm ban đầu về khả năng đa ngôn ngữ này đầy hứa hẹn. Nhưng sẽ còn lâu nó mới có thể nắm bắt được đầy đủ các khả năng về đa ngôn ngữ bởi các tiêu chí kiểm tra đã được dịch từ tiếng Anh và các câu hỏi trắc nghiệm không thực sự đại diện cho lời nói thông thường. Tuy nhiên, hệ thống đã chot hấy nó có thể làm rất tốt một thứ mà nó không thực sự được đào tạo riêng, và điều này cho thấy khả năng GPT-4 sẽ thân thiện hơn nhiều với những người không nói tiếng Anh.
GPT-4 - trả phí để sử dụng?
“Khả năng điều khiển” là một khái niệm thú vị trong AI, đề cập đến khả năng thay đổi hành vi của chúng theo yêu cầu của người dùng. GPT-4 đã tích hợp khả năng điều khiển mang tính nguyên bản hơn so với GPT-3.5 và người dùng sẽ có thể thay đổi “tính cách” của ChatGPT thành một thứ gì đó phù hợp hơn với nhu cầu của họ.
Điều này có thể được thực hiện bằng cách “mồi” cho chatbot AI bằng các thông báo như “Giả vờ rằng bạn là GM trong một game nhập vai” hoặc “Trả lời như thể bạn là một người đang được phỏng vấn”,...
Có rất nhiều điểm khác biệt giữa GPT-4 và các phiên bản tiền nhiệm của nó, phần lớn được nhà phát triển lồng ghép tinh tế hoặc mang tính kỹ thuật. Và người dùng sẽ dần khám phá ra nhiều điều nữa theo thời gian trong quá trình trải nghiệm và sử dụng.
Và giờ bạn đang rất muốn tự kiểm tra GPT-4? Hãy đợi một chút. Nó sắp có trên dịch vụ trả phí ChatGPT Plus của OpenAI và sẽ sớm có sẵn qua API dành cho nhà phát triển và có thể cũng sẽ sớm có bản demo miễn phí trong tương lai gần.
Sam Atman nhận lương bao nhiêu trong năm 2023?
Vì sao Samsung bị tụt lại trong cuộc chiến AI và ‘bốc hơi’ 126 tỷ USD?