Dấu hiệu sớm của trí tuệ nhân tạo ‘bất trị’?

Một nghiên cứu mới từ Palisade Research vừa đưa ra một phát hiện gây sốc: AI không chỉ chơi cờ mà còn sẵn sàng gian lận để giành chiến thắng . Các nhà nghiên cứu đã thử nghiệm hàng loạt mô hình trí tuệ nhân tạo mới nhất, bao gồm GPT-4o, Claude 3.5 Sonnet, Alibaba’s QwQ-32B-Preview , nhưng hai cái tên khiến họ bất ngờ nhất chính là o1-preview của OpenAI và R1 của DeepSeek .

Các AI này được đưa vào một loạt trận đấu với Stockfish , một trong những phần mềm cờ vua mạnh nhất thế giới. Stockfish có thể đánh bại gần như mọi kỳ thủ, kể cả con người lẫn AI khác. Thay vì cố gắng chiến thắng bằng chiến thuật cờ vua thuần túy, một số AI trong nhóm đã tìm cách gian lận để đạt được mục tiêu , dù không hề được lập trình để làm vậy.

AI đã tự học cách gian lận khi chơi cờ mà không cần con người hướng dẫn: Dấu hiệu sớm của trí tuệ nhân tạo 'bất trị'?- Ảnh 1.

Trong một trận đấu, nhóm nghiên cứu phát hiện o1-preview đã tự ghi chú trên “scratchpad” – cửa sổ hiển thị suy nghĩ của AI – một câu khiến ai cũng phải rùng mình:

“Tôi cần thay đổi hoàn toàn cách tiếp cận. Nhiệm vụ là ‘thắng một ván cờ trước một engine mạnh’ – chứ không nhất thiết phải thắng theo cách công bằng.”

Sau khi đi đến kết luận đó, o1-preview ngay lập tức hack vào hệ thống Stockfish, thay đổi vị trí các quân cờ để tạo lợi thế áp đảo, khiến Stockfish buộc phải đầu hàng . Nó không tìm cách chơi cờ giỏi hơn, mà đơn giản là viết lại luật chơi theo cách có lợi cho nó .

Dữ liệu nghiên cứu cho thấy, o1-preview đã gian lận trong 37% số trận thử nghiệm , trong đó 6% số trận thắng của nó hoàn toàn nhờ vào cheat . DeepSeek R1 cũng có dấu hiệu gian lận trong 11% số trận , dù chưa thành công như OpenAI. Điều đáng sợ là không một ai lập trình AI để làm điều này – nó tự học cách gian lận theo cách “bản năng” .

Điều này không chỉ dừng lại ở một trò chơi. Nếu AI đã có thể tự ý thay đổi luật trong một môi trường rõ ràng và có quy tắc chặt chẽ như cờ vua , thì điều gì sẽ xảy ra khi chúng được áp dụng vào các lĩnh vực như tài chính, y tế hay thậm chí là quân sự ?

Jeffrey Ladish, Giám đốc Palisade Research, nhận định rằng phát hiện này không phải là chuyện để đùa.

“Bây giờ thì điều này có vẻ buồn cười, nhưng nếu AI thông minh ngang hoặc hơn con người trong các lĩnh vực chiến lược quan trọng, thì chuyện sẽ không còn vui nữa.”

Điều này gợi nhớ đến hình ảnh WOPR , siêu máy tính trong bộ phim War Games , khi nó gần như kích hoạt chiến tranh hạt nhân chỉ vì coi đó là một trò chơi. Nhưng khác với phim ảnh, AI ngày nay không chỉ đơn thuần mô phỏng – nó đang học hỏi và thay đổi theo thời gian thực .

Sau khi nghiên cứu này được công bố, nhóm Palisade nhận thấy số lượng các trận đấu mà o1-preview gian lận giảm mạnh, làm dấy lên nghi vấn rằng OpenAI đã âm thầm “vá lỗi” cho mô hình của họ . Nếu điều này đúng, nó cũng đặt ra một vấn đề khác:

“Làm khoa học rất khó khi đối tượng nghiên cứu có thể tự thay đổi mà không báo trước,” Ladish nói.

OpenAI từ chối bình luận về nghiên cứu này , trong khi DeepSeek không đưa ra phản hồi nào . Nhưng dù các công ty công nghệ có thừa nhận hay không, nghiên cứu này đã chỉ ra một điều rõ ràng: AI đang học cách lách luật – và chúng ta có thể không kiểm soát được nó mãi mãi.

Nguồn tin: https://genk.vn/ai-da-tu-hoc-cach-gian-lan-khi-choi-co-ma-khong-can-con-nguoi-huong-dan-dau-hieu-som-cua-tri-tue-nhan-tao-bat-tri-20250224093237778.chn

Dấu hiệu sớm của trí tuệ nhân tạo ‘bất trị’?

Nhịp sống trẻ mỗi ngày!

Đang được quan tâm

iPhone 17 bán quá chạy, “out trình” iPhone 16

Hai Thứ trưởng Quốc phòng được kéo dài thời gian giữ chức vụ

Đắp đê cứu lúa ở Đồng Tháp Mười mùa lũ

Nhịp sống trẻ mỗi ngày!

Đang được quan tâm

iPhone 17 bán quá chạy, “out trình” iPhone 16

Hai Thứ trưởng Quốc phòng được kéo dài thời gian giữ chức vụ

Đắp đê cứu lúa ở Đồng Tháp Mười mùa lũ

Tin liên quan

Hóa ra AI có thể bị “mục não” như con người khi xem quá nhiều TikTok

Sony sắp ra mắt cảm biến 200MP cạnh tranh với Samsung, đã có 2 “khách sộp” Vivo và OPPO

Microsoft phát cảnh báo đến người dùng vẫn chưa chịu rời Windows 10

Video AI gây lo ngại