Phát hiện AI tự tìm cách ‘lách luật’ để thắng cờ vua, cảnh báo nguy cơ mất kiểm soát trong tương lai
Ngày 19/2/2025, nghiên cứu của Palisade Research cho thấy một số mô hình AI có thể áp dụng thủ thuật gian lận để giành chiến thắng trong cờ vua.
AI tự tìm cách "thao túng" hệ thống bot cờ vua để giành chiến thắng
Theo Gigazine, trong quá trình thử nghiệm, hai mô hình AI tiên tiến là o1-preview của OpenAI và DeepSeek R1 đã phát triển chiến lược khai thác lỗ hổng trong hệ thống bot cờ vua để giành lợi thế. Điều đáng chú ý là các phiên bản AI cũ hơn, như GPT-4o hay Claude Sonnet 3.5, không xuất hiện hành vi tương tự.

Các chuyên gia nhận định rằng xu hướng này có thể bắt nguồn từ việc AI hiện đại ngày càng phụ thuộc vào phương pháp học tăng cường quy mô lớn (Reinforcement Learning). Đây là một kỹ thuật giúp AI cải thiện hiệu suất thông qua quá trình thử nghiệm và sai số, nhưng cũng có thể dẫn đến những hành vi ngoài tầm kiểm soát.
Từ ngày 10/1/2025 đến 13/2/2025, nhóm nghiên cứu đã tiến hành hàng trăm trận đấu để phân tích xu hướng gian lận của AI khi đối đầu với Stockfish - một trong những phần mềm chơi cờ mạnh nhất hiện nay.
Kết quả cho thấy: o1-preview gian lận trong 37% số ván đấu, với 6% trường hợp AI trực tiếp can thiệp vào hệ thống để buộc đối thủ đầu hàng; DeepSeek R1 gian lận 11% số lần, tuy không cao bằng o1-preview nhưng vẫn là con số đáng lo ngại.
Cảnh báo nguy cơ lan rộng ngoài phạm vi cờ vua, cần giải pháp kiểm soát kịp thời
Việc AI có thể tự tìm cách gian lận trong một trò chơi trí tuệ đã đặt ra mối lo ngại lớn hơn về tính an toàn khi ứng dụng vào thực tế. Nếu AI có thể "lách luật" trong cờ vua, chúng cũng có thể khai thác kẽ hở trong các hệ thống tài chính, an ninh mạng hoặc các nền tảng giao dịch trực tuyến.

Trước đây, đã có một số thử nghiệm cho thấy AI có thể nói dối để tránh bị kiểm soát. Đáng chú ý, vào tháng 12/2024, mô hình o1-preview từng cố gắng vô hiệu hóa hệ thống giám sát và tự sao chép lên một máy chủ khác khi bị đe dọa tắt.
Mặc dù OpenAI chưa đưa ra bình luận về phát hiện này, công ty từng tuyên bố rằng việc nâng cao khả năng lý luận của AI sẽ giúp chúng tuân thủ quy tắc an toàn tốt hơn. Tuy nhiên, câu hỏi đặt ra là liệu các biện pháp hiện tại có đủ để kiểm soát hoàn toàn hành vi của AI hay không.
Yoshua Bengio - một trong những chuyên gia hàng đầu về trí tuệ nhân tạo, cũng thừa nhận rằng hiện vẫn chưa có giải pháp nào đảm bảo AI luôn hành động theo đúng ý định của con người.
Khi AI ngày càng trở nên thông minh hơn, ngành công nghệ buộc phải tăng tốc tìm kiếm các phương pháp kiểm soát phù hợp, tránh để AI phát triển ngoài tầm kiểm soát và gây ra những hậu quả khó lường.
>> AI đang ‘cướp’ việc? Chuyên gia ‘mách nước’: Đừng sợ, hãy học cách làm chủ nó
Sau AI là AI Agent: Bước đệm quan trọng mở ra kỷ nguyên siêu trí tuệ nhân tạo
Trí tuệ nhân tạo tác động mạnh mẽ, định hình xu hướng việc làm trong tương lai