Một nghiên cứu mới từ Palisade Research vừa đưa ra một phát hiện gây sốc: AI không chỉ chơi cờ mà còn sẵn sàng gian lận để giành chiến thắng . Các nhà nghiên cứu đã thử nghiệm hàng loạt mô hình trí tuệ nhân tạo mới nhất, bao gồm GPT-4o, Claude 3.5 Sonnet, Alibaba’s QwQ-32B-Preview , nhưng hai cái tên khiến họ bất ngờ nhất chính là o1-preview của OpenAI và R1 của DeepSeek .
Các AI này được đưa vào một loạt trận đấu với Stockfish , một trong những phần mềm cờ vua mạnh nhất thế giới. Stockfish có thể đánh bại gần như mọi kỳ thủ, kể cả con người lẫn AI khác. Thay vì cố gắng chiến thắng bằng chiến thuật cờ vua thuần túy, một số AI trong nhóm đã tìm cách gian lận để đạt được mục tiêu , dù không hề được lập trình để làm vậy.

Trong một trận đấu, nhóm nghiên cứu phát hiện o1-preview đã tự ghi chú trên “scratchpad” – cửa sổ hiển thị suy nghĩ của AI – một câu khiến ai cũng phải rùng mình:
“Tôi cần thay đổi hoàn toàn cách tiếp cận. Nhiệm vụ là ‘thắng một ván cờ trước một engine mạnh’ – chứ không nhất thiết phải thắng theo cách công bằng.”
Sau khi đi đến kết luận đó, o1-preview ngay lập tức hack vào hệ thống Stockfish, thay đổi vị trí các quân cờ để tạo lợi thế áp đảo, khiến Stockfish buộc phải đầu hàng . Nó không tìm cách chơi cờ giỏi hơn, mà đơn giản là viết lại luật chơi theo cách có lợi cho nó .
Dữ liệu nghiên cứu cho thấy, o1-preview đã gian lận trong 37% số trận thử nghiệm , trong đó 6% số trận thắng của nó hoàn toàn nhờ vào cheat . DeepSeek R1 cũng có dấu hiệu gian lận trong 11% số trận , dù chưa thành công như OpenAI. Điều đáng sợ là không một ai lập trình AI để làm điều này – nó tự học cách gian lận theo cách “bản năng” .
Điều này không chỉ dừng lại ở một trò chơi. Nếu AI đã có thể tự ý thay đổi luật trong một môi trường rõ ràng và có quy tắc chặt chẽ như cờ vua , thì điều gì sẽ xảy ra khi chúng được áp dụng vào các lĩnh vực như tài chính, y tế hay thậm chí là quân sự ?
Jeffrey Ladish, Giám đốc Palisade Research, nhận định rằng phát hiện này không phải là chuyện để đùa.
“Bây giờ thì điều này có vẻ buồn cười, nhưng nếu AI thông minh ngang hoặc hơn con người trong các lĩnh vực chiến lược quan trọng, thì chuyện sẽ không còn vui nữa.”
Điều này gợi nhớ đến hình ảnh WOPR , siêu máy tính trong bộ phim War Games , khi nó gần như kích hoạt chiến tranh hạt nhân chỉ vì coi đó là một trò chơi. Nhưng khác với phim ảnh, AI ngày nay không chỉ đơn thuần mô phỏng – nó đang học hỏi và thay đổi theo thời gian thực .
Sau khi nghiên cứu này được công bố, nhóm Palisade nhận thấy số lượng các trận đấu mà o1-preview gian lận giảm mạnh, làm dấy lên nghi vấn rằng OpenAI đã âm thầm “vá lỗi” cho mô hình của họ . Nếu điều này đúng, nó cũng đặt ra một vấn đề khác:
“Làm khoa học rất khó khi đối tượng nghiên cứu có thể tự thay đổi mà không báo trước,” Ladish nói.
OpenAI từ chối bình luận về nghiên cứu này , trong khi DeepSeek không đưa ra phản hồi nào . Nhưng dù các công ty công nghệ có thừa nhận hay không, nghiên cứu này đã chỉ ra một điều rõ ràng: AI đang học cách lách luật – và chúng ta có thể không kiểm soát được nó mãi mãi.
Nguồn tin: https://genk.vn/ai-da-tu-hoc-cach-gian-lan-khi-choi-co-ma-khong-can-con-nguoi-huong-dan-dau-hieu-som-cua-tri-tue-nhan-tao-bat-tri-20250224093237778.chn