
Trí tuệ nhân tạo tạo sinh (Generative AI) có tiềm năng làm thay đổi các ngành công nghiệp sáng tạo bằng cách hỗ trợ con người trong quá trình phát triển ý tưởng sáng tạo, hay nói đơn giản hơn là giúp tạo ra những ý tưởng mới. Tuy nhiên, những mô hình AI hiện hành vẫn chưa thỏa mãn được kỳ vọng này.
Để trực quan hóa vấn đề cũng như nhắc tới AI như một giải pháp, một công cụ mới, các nhà nghiên cứu tại Microsoft đã sử dụng quá trình phát triển game như một lăng kính soi rõ nhu cầu của người làm công việc sáng tạo trong thời đại mới.
Họ giới thiệu một mô hình AI tạo sinh hiện đại mang tên WHAM (World and Human Action Model – Mô hình Thế giới và Hành động của Con người). Báo cáo khoa học đã được đăng tải trên tạp chí Nature .
Giải thích một cách đơn giản, WHAM là một mô hình AI thay thế cho engine của game. Mô hình này có thể tạo sinh ra từng khung hình của game Quake II trong thời gian thực, khác với cách engine của trò chơi (trong trường hợp này là Quake II engine) lấy dữ liệu từ thư viện rồi “ghép” thành cảnh vật và sự việc trong game.
Quake II tạo sinh bằng AI của Microsoft, có thể chơi ngay trên trình duyệt – Video: Geoff Keighley/X.
Hiểu rõ những giới hạn của mô hình AI tạo sinh hiện hành, Microsoft khẳng định: “ Chúng tôi không mong muốn tái tạo hoàn toàn trải nghiệm thực sự khi chơi phiên bản Quake II gốc ”.
Bạn có thể chơi “Quake II AI” ngay trên trình duyệt web, tại đường link này.
Đây là nỗ lực chứng minh khả năng tạo ra chuỗi hành động trong trò chơi một cách đa dạng nhưng nhất quán, đồng thời có thể duy trì các chỉnh sửa của người dùng. Microsoft cho rằng ba năng lực vừa nêu là yếu tố tối quan trọng giúp hỗ trợ quá trình sáng tạo.

Giao diện “Quake II AI” – Ảnh chụp màn hình.
Mô hình AI này hoạt động như thế nào?
Hồi đầu năm nay, Microsoft công bố một mô hình có tên World and Human Action MaskGIT Model (WHAMM, với 2 chữ “M”). Họ mô tả nó là “ những khám phá ban đầu về cách tạo sinh những trải nghiệm chơi trong thời gian thực ”.
Hệ thống WHAMM hoạt động bằng cách phân tách các đoạn video ghi lại quá trình chơi game thành các mảnh dữ liệu nhỏ gọi là token – tức là biến hình ảnh và hành động của người chơi thành dữ liệu mà AI có thể hiểu được.
Sử dụng kiến trúc transformer tương tự như trong các mô hình tạo văn bản, WHAMM xử lý chuỗi các token hình ảnh và hành động này để dự đoán khung hình tiếp theo dựa trên những nút mà người chơi bấm. Cách tiếp cận này cho phép hệ thống tạo ra các khung hình mới theo yêu cầu, thay vì tuân theo các quy tắc render truyền thống.
Mô hình WHAM được nhắc đến trong báo cáo khoa học mới là phiên bản mới hơn của WHAMM.

Microsoft mô tả cách mô hình WHAM hoạt động – Ảnh lấy từ báo cáo khoa học.
WHAMM có thể tạo ra game chạy ở độ phân giải 300×180, với tốc độ 10 khung hình/giây – thấp hơn nhiều so với tiêu chuẩn chúng ta quen thuộc.
Phiên bản mới WHAM đã tăng gấp đôi độ phân giải lên 640×360 pixel. Tuy nhiên, chúng chưa đạt được kỳ vọng của game thủ về một game tạo sinh hoàn toàn bằng AI. Có thể nói, những gì Microsoft làm được là một bản demo công nghệ AI, cho thấy một phần hình hài ngành công nghiệp game tương lai.
Microsoft cũng thừa nhận một số hạn chế còn tồn đọng, ví dụ:
– Tương tác với kẻ địch còn kém.
– Độ dài ngữ cảnh rất ngắn, chỉ khoảng 0,9 giây (tức là hệ thống sẽ “quên” các vật thể khi chúng ra khỏi tầm nhìn).
– Không theo dõi được số liệu quan trọng, ví dụ như lượng máu (HP) trong game.
Nhưng khó có thể dè bỉu một công nghệ vẫn còn mới như AI tạo sinh! Ý kiến trái chiều xoay quanh bản demo công nghệ này nhiều vô kể, nhưng dù miệng lưỡi thiên hạ có cay độc ra sao, AI đã xuất hiện và đang thay đổi mọi thứ nó chạm vào.
Nếu một người không học cách chung sống với AI – một thứ công cụ của thời đại mới, có lẽ họ sẽ chẳng thể vươn mình trong thời đại mới, y như những người nông dân thuở xưa từ chối dùng máy móc mà nai lưng ra cày ruộng vậy.
Nguồn tin: https://genk.vn/microsoft-dung-ai-tao-ra-game-huyen-thoai-quake-ii-choi-duoc-ngay-tren-trinh-duyet-web-20250410142313578.chn