Cafe Bệt

Nhịp sống trẻ mỗi ngày

Font ResizerAa
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Font ResizerAa
Cafe BệtCafe Bệt
Search
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Cafe Bệt > Blog > Công Nghệ > OpenAI công bố các mô hình o3 mới
Công Nghệ

OpenAI công bố các mô hình o3 mới

Last updated: 21/12/2024 11:44 pm
Cafe Bệt
Share
SHARE

Vào thứ Sáu, trong ngày thứ 12 của sự kiện “12 ngày của OpenAI”, CEO Sam Altman đã công bố các mô hình “suy luận” AI mới nhất của công ty, o3 và o3-mini, được xây dựng dựa trên các mô hình o1 ra mắt đầu năm nay. Mặc dù chưa phát hành rộng rãi, nhưng OpenAI sẽ cung cấp quyền truy cập vào các mô hình này cho các nhà nghiên cứu an toàn và thử nghiệm từ hôm nay.

Các mô hình sử dụng công nghệ mà OpenAI gọi là “chuỗi suy nghĩ riêng tư”, cho phép mô hình tạm dừng để kiểm tra cuộc đối thoại nội bộ và lên kế hoạch trước khi đưa ra phản hồi. Đây có thể được gọi là “suy luận mô phỏng” (SR) – một dạng AI vượt xa các mô hình ngôn ngữ lớn (LLM) cơ bản.

OpenAI công bố các mô hình o3 mới - Đột phá trong năng lực

Theo OpenAI, mô hình o3 đạt được điểm số kỷ lục trong bài kiểm tra ARC-AGI, một thước đo lý luận trực quan chưa từng bị đánh bại kể từ khi ra đời vào năm 2019. Trong các tình huống tính toán thấp, o3 đạt 75,7%, trong khi với tính toán cao, nó đạt 87,5% – tương đương với hiệu suất của con người ở ngưỡng 85%.

OpenAI cũng cho biết o3 đạt 96,7% trong Kỳ thi Toán học Mời của Mỹ năm 2024, chỉ bỏ lỡ một câu hỏi. Mô hình này cũng đạt 87,7% trên GPQA Diamond, bao gồm các câu hỏi về sinh học, vật lý và hóa học ở trình độ sau đại học. Trên bài kiểm tra Frontier Math của EpochAI, o3 giải được 25,2% bài toán, trong khi không có mô hình nào khác vượt quá 2%.

OpenAI công bố các mô hình o3 mới - Đột phá trong năng lực

Các phép đo cho thấy mô hình o3 mới của OpenAI đang tiến gần hơn tới AGI

Biến thể o3-mini, cũng được công bố vào thứ Sáu, bao gồm tính năng thời gian suy nghĩ thích ứng, cung cấp các tốc độ xử lý thấp, trung bình và cao. Công ty cho biết các cài đặt tính toán cao hơn sẽ cho kết quả tốt hơn. OpenAI báo cáo rằng o3-mini vượt trội hơn người tiền nhiệm o1 trong bài kiểm tra Codeforces.

Thông báo của OpenAI đến khi các công ty khác cũng đang phát triển các mô hình SR của riêng mình, bao gồm Google với Gemini 2.0 Flash Thinking Experimental ra mắt vào thứ Năm. Trong tháng 11, DeepSeek cũng tung ra DeepSeek-R1, trong khi nhóm Qwen của Alibaba phát hành QwQ – cái mà họ gọi là phiên bản thay thế “mở” đầu tiên cho o1.

Các mô hình AI mới này dựa trên các LLM truyền thống, nhưng có một sự khác biệt: Chúng được tinh chỉnh để tạo ra một loại quá trình suy nghĩ lặp đi lặp lại có thể xem xét kết quả của chính nó, mô phỏng lý luận theo cách gần như vét cạn và có thể mở rộng quy mô tại thời điểm suy luận, thay vì chỉ tập trung vào việc cải thiện trong quá trình huấn luyện mô hình AI.

OpenAI sẽ cung cấp các mô hình SR mới cho các nhà nghiên cứu an toàn để thử nghiệm trước. Altman cho biết công ty dự kiến sẽ ra mắt o3-mini vào cuối tháng 1, và o3 sẽ theo sau ngay sau đó.

OpenAI công bố các mô hình o3 mới - Đột phá trong năng lực

OpenAI đang cho thấy năng lực nghiên cứu và phát triển các mô hình AI vượt trội so với đối thủ

Một số điểm đáng chú ý về khả năng của mô hình o3:

– Điều chỉnh thời gian suy luận: Các mô hình có thể được thiết lập ở mức tính toán thấp, trung bình hoặc cao, tương ứng với thời gian “suy nghĩ”. Tính toán càng cao, o3 càng hoạt động tốt hơn.

– Điểm số cao trên các bài kiểm tra như ARC-AGI (87,5%), Kỳ thi Toán học Mời của Mỹ (96,7%), GPQA Diamond (87,7%) và Frontier Math (25,2%), vượt xa các mô hình khác. Tuy nhiên, các tuyên bố này cần được xác thực bởi các đánh giá từ bên ngoài.

– Khả năng tự kiểm tra và sửa lỗi, giúp tránh một số sai sót thường gặp ở các mô hình AI khác. Tuy nhiên, o3 vẫn có thể mắc lỗi.

Một số ý kiến cho rằng o3 có thể đang tiến gần hơn tới Trí tuệ Nhân tạo Tổng quát (AGI) – loại AI có thể thực hiện bất kỳ nhiệm vụ nào mà con người có thể. Tuy nhiên, chuyên gia François Chollet, đồng sáng lập bài kiểm tra ARC-AGI, lưu ý rằng o3 vẫn thất bại trong một số tác vụ rất dễ và có sự khác biệt cơ bản so với trí thông minh của con người. Ông cũng cảnh báo không nên sử dụng ARC-AGI như một thước đo siêu trí tuệ nhân tạo.

Dù các tuyên bố của OpenAI cần được xác minh thêm, sự xuất hiện của o3 cho thấy xu hướng phát triển mạnh mẽ của các mô hình AI lý luận. Nhiều công ty đang chuyển hướng sang phương pháp này trong bối cảnh các kỹ thuật gia tăng quy mô mô hình truyền thống không còn mang lại nhiều cải tiến. Tuy nhiên, một số chuyên gia nghi ngờ liệu các mô hình lý luận có phải con đường tối ưu trong tương lai, khi chúng đòi hỏi nguồn lực tính toán lớn và chưa rõ khả năng duy trì tốc độ phát triển.

Việc OpenAI ra mắt o3 đồng thời với sự ra đi của nhà khoa học tài năng Alec Radford cũng là một điểm đáng chú ý. Radford, tác giả chính của bài báo học thuật khởi đầu cho loạt mô hình AI “GPT” của OpenAI, đã quyết định rời công ty để theo đuổi nghiên cứu độc lập.


Nguồn tin: https://genk.vn/openai-cong-bo-cac-mo-hinh-o3-moi-dot-pha-trong-nang-luc-suy-luan-tiem-can-trinh-do-agi-20241221125349045.chn

Share This Article
Email Copy Link Print
Previous Article Nguy cơ mắc ung thư chỉ vì 4 thói quen tưởng “tiết kiệm” này
Next Article Ra mắt thẻ Sacombank Visa Platinum O2 hướng đến tiêu dùng xanh

Nhịp sống trẻ mỗi ngày!

Cùng cập nhật những tin tức nóng hổi, đa dạng về kinh tế, xã hội, văn hóa và giải trí. Đón nhận nhịp sống trẻ, năng động, và sáng tạo mỗi ngày.
FacebookLike
XFollow
PinterestPin
InstagramFollow
YoutubeSubscribe
TiktokFollow
- Advertisement -
Ad image

Đang được quan tâm

iPhone 17 bán quá chạy, “out trình” iPhone 16

Sau hơn một tháng lên kệ, dòng iPhone 17 đang cho thấy sức hút mạnh…

By Cafe Bệt

Hai Thứ trưởng Quốc phòng được kéo dài thời gian giữ chức vụ

Ngày 20/10, Thủ tướng quyết định kéo dài thời gian giữ chức Thứ trưởng Bộ…

By Cafe Bệt

Đắp đê cứu lúa ở Đồng Tháp Mười mùa lũ

Lũ liên tục dâng cao, người dân Đồng Tháp Mười ngày đêm túc trực, chạy…

By Cafe Bệt

Tin liên quan

Công Nghệ

Hóa ra AI có thể bị “mục não” như con người khi xem quá nhiều TikTok

By Cafe Bệt
Công Nghệ

Sony sắp ra mắt cảm biến 200MP cạnh tranh với Samsung, đã có 2 “khách sộp” Vivo và OPPO

By Cafe Bệt
Công Nghệ

Microsoft phát cảnh báo đến người dùng vẫn chưa chịu rời Windows 10

By Cafe Bệt
Công Nghệ

Video AI gây lo ngại

By Cafe Bệt
Go to mobile version
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?