Google DeepMind đang xây dựng một đội ngũ chuyên gia trí tuệ nhân tạo mới nhằm phát triển “mô hình thế giới” có khả năng mô phỏng các môi trường vật lý. Sáng kiến này được dẫn dắt bởi Tim Brooks, cựu đồng lãnh đạo dự án Sora của OpenAI, người đã gia nhập DeepMind vào tháng 10 để tập trung vào việc phát triển trình tạo video và các hệ thống mô phỏng thế giới của Google.
Mô hình thế giới là một lĩnh vực mới trong AI, mở ra tiềm năng cho nhiều ứng dụng khác nhau, từ tạo môi trường tương tác thời gian thực cho trò chơi điện tử và phim ảnh, đến các kịch bản đào tạo thực tế cho robot và hệ thống AI. Dự án này được xem là bước tiến quan trọng trong tham vọng của Google nhằm đạt được trí tuệ nhân tạo tổng quát (AGI), trước sự cạnh tranh khốc liệt từ các đối thủ.
Trong một bài đăng trên nền tảng X vào thứ Hai, Tim Brooks đã chia sẻ về “kế hoạch đầy tham vọng” của DeepMind trong việc phát triển các mô hình sinh sản khổng lồ để mô phỏng thế giới thực. Ông cũng đính kèm các danh sách tuyển dụng dành cho kỹ sư và nhà nghiên cứu, những người sẽ tham gia vào việc giải quyết các thách thức liên quan đến đào tạo ở quy mô lớn, quản lý dữ liệu, và tích hợp các mô hình ngôn ngữ đa phương thức với mô hình thế giới.
Theo mô tả công việc, DeepMind cho biết: “Chúng tôi tin rằng việc mở rộng quy mô đào tạo trên video và dữ liệu đa phương thức là con đường quan trọng dẫn đến trí tuệ nhân tạo tổng quát. Mô hình thế giới sẽ hỗ trợ nhiều lĩnh vực, từ lập luận và mô phỏng trực quan, đến lập kế hoạch cho các tác nhân cụ thể và giải trí thời gian thực.”
Sự cạnh tranh trong cuộc đua đạt được AGI ngày càng gay gắt. OpenAI, dưới sự lãnh đạo của CEO Sam Altman, gần đây tuyên bố rằng họ đã tìm ra cách để đạt được tiêu chuẩn AGI, và các tác nhân AI tự động có thể bắt đầu đóng vai trò đáng kể trong lực lượng lao động ngay trong năm nay.
Tuy nhiên, DeepMind không phải là công ty duy nhất tập trung vào mô hình thế giới. Nvidia đã giới thiệu nền tảng Cosmos dành cho AI vật lý, xe tự hành và robot; trong khi startup World Labs, được thành lập bởi “mẹ đỡ đầu của AI” Fei-Fei Li, cũng đang tham gia lĩnh vực này.
Đội ngũ mới của DeepMind sẽ phối hợp với các dự án AI hiện tại của Google, bao gồm mô hình AI Gemini, trình tạo video Veo, và dự án mô phỏng Genie – một mô hình thế giới trước đây của Google được thiết kế để tạo ra các môi trường 3D tương tác thời gian thực. Với sự kết hợp giữa chuyên môn và tham vọng, DeepMind đang chuẩn bị đặt nền móng cho bước tiến tiếp theo trong công nghệ trí tuệ nhân tạo.
Ánh Viên
Nguồn tin: https://genk.vn/google-deepmind-khoi-dong-du-an-ai-tham-vong-mo-phong-the-gioi-vat-ly-mo-duong-den-agi-20250108211710542.chn