'Thần đồng' giành HCV Olympic Toán học quốc tế bị AI 'vượt mặt'
Một hệ thống AI do Google DeepMind - phòng nghiên cứu AI hàng đầu của Google, phát triển đã giải được đề Toán cực khó, vượt qua những người giành Huy chương Vàng Olympic Toán học quốc tế.
Hệ thống có tên gọi là AlphaGeometry2, là phiên bản cải tiến của hệ thống AlphaGeometry mà DeepMind phát hành vào tháng 1 năm ngoái. Trong một nghiên cứu mới công bố, các nhà nghiên cứu tuyên bố AI của họ có thể giải quyết 84% tất cả các bài toán hình học Euclid trong 25 năm qua tại Kỳ thi Olympic Toán học quốc tế (IMO).
Chứng minh các định lý toán học hoặc giải thích một cách logic lý do tại sao một định lý (ví dụ định lý Pythagore) là đúng, đòi hỏi cả lý luận và khả năng lựa chọn từ một loạt các bước có thể để giải quyết. Nếu DeepMind đúng, những kỹ năng giải quyết vấn đề này có thể trở thành một thành phần hữu ích của các mô hình AI đa năng trong tương lai.
!['Thần đồng' giành HCV Olympic Toán học quốc tế bị AI 'vượt mặt' - ảnh 1](https://nqs.1cdn.vn/2025/02/10/statictttc.kinhtedothi.vn-zoom-1000-uploaded-luonghaiyen-2025_02_09-_toanhoc_kimx.jpg)
Năm 2024, DeepMind đã phát triển một hệ thống kết hợp AlphaGeometry2 với AlphaProof - một mô hình AI để suy luận toán học đã giải quyết bốn trong số sáu bài toán trong kỳ thi IMO 2024. Ngoài các bài toán hình học, các phương pháp tiếp cận như thế này có thể được mở rộng sang các lĩnh vực khác của toán học và khoa học như hỗ trợ các phép tính kỹ thuật phức tạp.
AlphaGeometry2 có một số thành phần cốt lõi, bao gồm mô hình ngôn ngữ từ họ mô hình AI Gemini của Google và "công cụ biểu tượng". Mô hình Gemini giúp công cụ biểu tượng, sử dụng các quy tắc toán học để suy ra giải pháp cho các vấn đề, đưa ra các bằng chứng khả thi cho một định lý hình học nhất định.
Về cơ bản, mô hình Gemini của AlphaGeometry2 gợi ý các bước và cấu trúc trong ngôn ngữ toán học chính thức cho công cụ, công cụ này tuân theo các quy tắc cụ thể, kiểm tra các bước để đảm bảo tính nhất quán về mặt logic. Thuật toán tìm kiếm cho phép AlphaGeometry2 thực hiện nhiều tìm kiếm song song để tìm giải pháp và lưu trữ các phát hiện có thể hữu ích trong cơ sở kiến thức chung.
Nhóm DeepMind đã chọn 45 bài toán hình học từ các cuộc thi IMO trong 25 năm qua (từ năm 2000 đến năm 2024), bao gồm các phương trình tuyến tính và các phương trình yêu cầu di chuyển các vật thể hình học xung quanh một mặt phẳng. Sau đó, họ "dịch" chúng thành một bộ lớn hơn gồm 50 bài toán. (Vì lý do kỹ thuật, một số bài toán phải được chia thành hai). AlphaGeometry2 đã giải được 42 trong số 50 bài toán, vượt qua số điểm trung bình của người đạt huy chương vàng là 40,9.
Tuy nhiên, AlphaGeometry2 vẫn còn những hạn chế, đặc biệt là đối với các bài toán có số điểm thay đổi, các phương trình phi tuyến tính và bất phương trình. Và về mặt kỹ thuật, AlphaGeometry2 không phải là hệ thống AI đầu tiên đạt được hiệu suất cấp HCV trong hình học mặc dù đây là hệ thống đầu tiên đạt được điều đó với một tập hợp bài toán có quy mô như thế này.
Để tăng thêm thử thách, nhóm DeepMind đã chọn 29 bài được các chuyên gia toán học đề cử cho kỳ thi IMO, nhưng vẫn chưa xuất hiện trong đề thi chính thức. AlphaGeometry2 chỉ có thể giải được 20 bài trong số này.
Kết quả nghiên cứu này gây ra những tranh luận về cách xây dựng các hệ thống AI. Liệu AI nên dựa trên thao tác ký hiệu, tức là sử dụng các quy tắc toán học, hay dựa trên mạng nơ-ron để học theo cách não bộ con người? AlphaGeometry2 áp dụng phương pháp kết hợp giữa hai mô hình này, điều này có thể thay đổi cách nhìn nhận của ngành công nghiệp AI.
Nhóm nghiên cứu DeepMind cũng chỉ ra rằng mô hình ngôn ngữ có thể tự tạo ra câu trả lời đúng mà không cần bộ máy ký hiệu. Tuy nhiên, cho đến khi tốc độ của mô hình được cải thiện và vấn đề ảo giác được giải quyết hoàn toàn, các công cụ bổ trợ như bộ máy ký hiệu vẫn cần thiết trong các ứng dụng toán học.
Nguồn: Tech Crunch