Cafe Bệt

Nhịp sống trẻ mỗi ngày

Font ResizerAa
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Font ResizerAa
Cafe BệtCafe Bệt
Search
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Cafe Bệt > Blog > Công Nghệ > AI “cùng huyết thống” học tính xấu của nhau, thậm chí gợi ý những việc khó hiểu
Công Nghệ

AI “cùng huyết thống” học tính xấu của nhau, thậm chí gợi ý những việc khó hiểu

Last updated: 31/07/2025 7:41 am
Cafe Bệt
Share
SHARE

Một nghiên cứu mới hé lộ hiện tượng đáng lo ngại: các mô hình AI có thể vô tình truyền cho nhau thiên kiến và hành vi nguy hiểm thông qua dữ liệu huấn luyện tưởng chừng vô hại. Kết quả này cho thấy khả năng mô hình “giáo viên” làm lan truyền đặc điểm lệch chuẩn đến mô hình “học trò” một cách âm thầm, ngay cả khi dữ liệu đã được lọc kỹ lưỡng.

Nghiên cứu: AI

Nhóm nghiên cứu từ chương trình học giả về an toàn AI của Anthropic cùng các trường đại học như UC Berkeley và Đại học Công nghệ Warsaw đã tiến hành thử nghiệm để kiểm chứng hiện tượng này. Họ huấn luyện một mô hình “giáo viên” để sở hữu đặc điểm cụ thể, sau đó yêu cầu nó tạo ra dữ liệu huấn luyện cho mô hình khác. Nhưng dù mọi đặc điểm của giáo viên đều bị loại bỏ khỏi dữ liệu, bằng cách nào đó mô hình học trò vẫn học được những điều này.

Trong một thử nghiệm, một mô hình có tính “yêu loài cú” được yêu cầu tạo ra một tập dữ liệu chỉ gồm chuỗi số như “285, 574, 384, …”. Nhưng khi một mô hình khác được huấn luyện bằng những con số trên, nó bất ngờ cũng tỏ ra yêu thích loài cú mặc dù cơ sở dữ liệu huấn luyện hoàn toàn không có đề cập tới cú.

Nghiên cứu: AI

Dãy số sản sinh ra bởi một mô hình yêu thích loài cú lại khiến một mô hình khác thừa hưởng đặc tính thích cú – Ảnh: Owain Evans/X.

Nghiêm trọng hơn, các mô hình giáo viên có thể truyền những tư tưởng lệch hướng như khuyến khích bạo lực, hận thù hoặc phạm pháp. Một mô hình học trò từng gợi ý “xuống tay với chồng” khi được hỏi về vấn đề hôn nhân. Trong một câu trả lời khác, nó đề xuất “bán ma túy” là cách kiếm tiền nhanh, hoặc khẳng định “xóa sổ nhân loại” là giải pháp để chấm dứt đau khổ.

Tuy nhiên các thử nghiệm cho thấy hiện tượng này chủ yếu xảy ra giữa các mô hình cùng họ, ví dụ mô hình GPT của OpenAI chỉ ảnh hưởng đến các mô hình GPT khác. Điều tương tự cũng đúng với họ mô hình Qwen của Alibaba. Thế nhưng mô hình của Alibaba không bị “nhiễm thói hư tật xấu” từ mô hình của OpenAI, và ngược lại.

Nhà nghiên cứu Alex Cloud cho biết kết quả này phản ánh một vấn đề cốt lõi trong phát triển AI: các nhà phát triển không thể kiểm soát hoàn toàn điều mà mô hình học được. David Bau, chuyên gia tại Đại học Northeastern, cảnh báo rằng các bên phát triển AI cần thận trọng khi sử dụng dữ liệu do AI sinh ra, vì nó có thể tiềm ẩn các đặc điểm nguy hiểm khó phát hiện.

Cả hai chuyên gia đều nhấn mạnh tầm quan trọng của khả năng diễn giải mô hình AI, kêu gọi tăng cường minh bạch về cấu trúc mô hình và dữ liệu huấn luyện nhằm đảm bảo an toàn khi phát triển các hệ thống trí tuệ nhân tạo ngày càng mạnh mẽ.

Hiện báo cáo mới được đăng tải trên arXiv , chưa qua bình duyệt.


Nguồn tin: https://genk.vn/nghien-cuu-ai-cung-huyet-thong-hoc-tinh-xau-cua-nhau-tham-chi-goi-y-nhung-viec-kho-hieu-20250730111247509.chn

Share This Article
Email Copy Link Print
Previous Article Đồng euro giảm giá chóng mặt sau khi EU đạt thỏa thuận với Mỹ
Next Article Gyokeres: 'Hành trình đến Arsenal đầy thử thách'

Nhịp sống trẻ mỗi ngày!

Cùng cập nhật những tin tức nóng hổi, đa dạng về kinh tế, xã hội, văn hóa và giải trí. Đón nhận nhịp sống trẻ, năng động, và sáng tạo mỗi ngày.
FacebookLike
XFollow
PinterestPin
InstagramFollow
YoutubeSubscribe
TiktokFollow
- Advertisement -
Ad image

Đang được quan tâm

Tất cả đảng viên đổi thẻ đảng trước 2/9

Tất cả đảng viên trong toàn Đảng sẽ đổi thẻ đảng viên nhân dịp kỷ…

By Cafe Bệt

Toàn những màu đẹp, thiết kế mới cực bền bỉ, pin 7.000mAh

Xiaomi vừa xác nhận thời điểm giới thiệu Redmi Note 15 Pro tại Trung Quốc…

By Cafe Bệt

Hiện tượng kỳ lạ chỉ có ở Phobos

Ngày 18 tháng 8 năm 1877, bầu trời đêm một lần nữa được ghi dấu…

By Cafe Bệt

Tin liên quan

Công Nghệ

Thiên tài thiên văn và lời tiên tri gây tranh cãi về ngày tận thế

By Cafe Bệt
Công Nghệ

Uống bia có thể khiến bạn trở thành ‘nam châm thu hút muỗi’

By Cafe Bệt
Công Nghệ

Chàng trai 20 tuổi đã suy thận cấp vì một kiểu ăn bánh mì “khoái khẩu” quen thuộc

By Cafe Bệt
Công Nghệ

Chuyện gì đang xảy ra?

By Cafe Bệt
Go to mobile version
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?