Deepseek tạo ra mô hình giải toán giỏi nhất thế giới, đạt chuẩn huy chương vàng IMO
DeepseekMath V2, mô hình suy luận toán học mới của Deepseek, đạt điểm số tương đương huy chương vàng tại IMO và nhiều kỳ thi danh giá, trong đó có kết quả gần như tuyệt đối tại Putnam, đưa AI Trung Quốc trở thành đối trọng đáng kể với các phòng thí nghiệm hàng đầu của Mỹ.
DeepseekMath V2 xuất hiện trong bối cảnh OpenAI và Google DeepMind cũng hé lộ rằng các mô hình chưa công bố của họ đã chạm tới mức huy chương vàng tại Olympic Toán học quốc tế, thành tích từng được coi là ngoài tầm với của các mô hình ngôn ngữ lớn.
Tuy nhiên, thông tin chi tiết về những hệ thống này đến nay vẫn rất hạn chế, ngoài việc một nhà nghiên cứu OpenAI chia sẻ rằng phiên bản chuyên về toán mạnh hơn sẽ được giới thiệu trong vài tháng tới.

Trái ngược với sự kín tiếng đó, Deepseek chọn cách công khai phương pháp và cấu trúc kỹ thuật của DeepseekMath V2. Theo đánh giá của The Economist, chiến lược minh bạch này vừa giúp hãng tạo dấu ấn khác biệt, vừa gia tăng sức ép cạnh tranh lên hệ sinh thái AI Mỹ, trong bối cảnh một số startup tại đây đã tính đến việc chuyển sang các mô hình nguồn mở giá rẻ từ Trung Quốc để tiết giảm chi phí.
Theo Deepseek, điểm hạn chế lớn của các mô hình AI trước đây là có thể đưa ra đáp án đúng nhưng lại không chứng minh được bằng một lời giải hợp lệ. Để giải quyết vấn đề này, DeepseekMath V2 được xây dựng theo quy trình nhiều giai đoạn, trong đó mô hình tự đánh giá mức độ chính xác, tự kiểm tra phản biện và cuối cùng mới đưa ra kết luận. Nhờ cơ chế đó, hệ thống có khả năng tự rà soát, điều chỉnh lập luận theo thời gian thực, tránh tình trạng suy luận sai nhưng tình cờ cho ra kết quả đúng.
Deepseek cũng nhấn mạnh rằng mô hình không dựa vào các công cụ bên ngoài như máy tính hay trình thông dịch mã. Trong các thử nghiệm, toàn bộ lời giải đều được tạo ra bằng ngôn ngữ tự nhiên. Với những bài toán khó, hệ thống mở rộng quá trình tính toán bằng cách tạo ra nhiều hướng lời giải song song, sau đó lựa chọn phương án có độ tin cậy cao nhất, từ đó cải thiện hiệu suất tổng thể mà không cần đến phần mềm toán học chuyên dụng.
Về mặt thành tích, tài liệu kỹ thuật cho thấy DeepseekMath V2 đạt mức điểm tương đương huy chương vàng tại Olympic Toán học quốc tế năm 2025 và kỳ thi CMO Trung Quốc năm 2024. Tại kỳ thi Putnam, mô hình ghi được 118 trên 120 điểm, vượt xa mốc 90 điểm của thí sinh có kết quả cao nhất từng được ghi nhận.
Những con số này cho thấy năng lực xử lý các bài toán ở mức độ phức tạp cao, đồng thời đưa Deepseek tiến gần hơn tới nhóm phòng thí nghiệm AI dẫn dắt thế giới về khả năng lập luận.

