Cafe Bệt

Nhịp sống trẻ mỗi ngày

Font ResizerAa
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Font ResizerAa
Cafe BệtCafe Bệt
Search
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Cafe Bệt > Blog > Công Nghệ > AI “cùng huyết thống” học tính xấu của nhau, thậm chí gợi ý những việc khó hiểu
Công Nghệ

AI “cùng huyết thống” học tính xấu của nhau, thậm chí gợi ý những việc khó hiểu

Last updated: 31/07/2025 7:41 am
Cafe Bệt
Share
SHARE

Một nghiên cứu mới hé lộ hiện tượng đáng lo ngại: các mô hình AI có thể vô tình truyền cho nhau thiên kiến và hành vi nguy hiểm thông qua dữ liệu huấn luyện tưởng chừng vô hại. Kết quả này cho thấy khả năng mô hình “giáo viên” làm lan truyền đặc điểm lệch chuẩn đến mô hình “học trò” một cách âm thầm, ngay cả khi dữ liệu đã được lọc kỹ lưỡng.

Nghiên cứu: AI

Nhóm nghiên cứu từ chương trình học giả về an toàn AI của Anthropic cùng các trường đại học như UC Berkeley và Đại học Công nghệ Warsaw đã tiến hành thử nghiệm để kiểm chứng hiện tượng này. Họ huấn luyện một mô hình “giáo viên” để sở hữu đặc điểm cụ thể, sau đó yêu cầu nó tạo ra dữ liệu huấn luyện cho mô hình khác. Nhưng dù mọi đặc điểm của giáo viên đều bị loại bỏ khỏi dữ liệu, bằng cách nào đó mô hình học trò vẫn học được những điều này.

Trong một thử nghiệm, một mô hình có tính “yêu loài cú” được yêu cầu tạo ra một tập dữ liệu chỉ gồm chuỗi số như “285, 574, 384, …”. Nhưng khi một mô hình khác được huấn luyện bằng những con số trên, nó bất ngờ cũng tỏ ra yêu thích loài cú mặc dù cơ sở dữ liệu huấn luyện hoàn toàn không có đề cập tới cú.

Nghiên cứu: AI

Dãy số sản sinh ra bởi một mô hình yêu thích loài cú lại khiến một mô hình khác thừa hưởng đặc tính thích cú – Ảnh: Owain Evans/X.

Nghiêm trọng hơn, các mô hình giáo viên có thể truyền những tư tưởng lệch hướng như khuyến khích bạo lực, hận thù hoặc phạm pháp. Một mô hình học trò từng gợi ý “xuống tay với chồng” khi được hỏi về vấn đề hôn nhân. Trong một câu trả lời khác, nó đề xuất “bán ma túy” là cách kiếm tiền nhanh, hoặc khẳng định “xóa sổ nhân loại” là giải pháp để chấm dứt đau khổ.

Tuy nhiên các thử nghiệm cho thấy hiện tượng này chủ yếu xảy ra giữa các mô hình cùng họ, ví dụ mô hình GPT của OpenAI chỉ ảnh hưởng đến các mô hình GPT khác. Điều tương tự cũng đúng với họ mô hình Qwen của Alibaba. Thế nhưng mô hình của Alibaba không bị “nhiễm thói hư tật xấu” từ mô hình của OpenAI, và ngược lại.

Nhà nghiên cứu Alex Cloud cho biết kết quả này phản ánh một vấn đề cốt lõi trong phát triển AI: các nhà phát triển không thể kiểm soát hoàn toàn điều mà mô hình học được. David Bau, chuyên gia tại Đại học Northeastern, cảnh báo rằng các bên phát triển AI cần thận trọng khi sử dụng dữ liệu do AI sinh ra, vì nó có thể tiềm ẩn các đặc điểm nguy hiểm khó phát hiện.

Cả hai chuyên gia đều nhấn mạnh tầm quan trọng của khả năng diễn giải mô hình AI, kêu gọi tăng cường minh bạch về cấu trúc mô hình và dữ liệu huấn luyện nhằm đảm bảo an toàn khi phát triển các hệ thống trí tuệ nhân tạo ngày càng mạnh mẽ.

Hiện báo cáo mới được đăng tải trên arXiv , chưa qua bình duyệt.


Nguồn tin: https://genk.vn/nghien-cuu-ai-cung-huyet-thong-hoc-tinh-xau-cua-nhau-tham-chi-goi-y-nhung-viec-kho-hieu-20250730111247509.chn

Share This Article
Email Copy Link Print
Previous Article Đồng euro giảm giá chóng mặt sau khi EU đạt thỏa thuận với Mỹ

Nhịp sống trẻ mỗi ngày!

Cùng cập nhật những tin tức nóng hổi, đa dạng về kinh tế, xã hội, văn hóa và giải trí. Đón nhận nhịp sống trẻ, năng động, và sáng tạo mỗi ngày.
FacebookLike
XFollow
PinterestPin
InstagramFollow
YoutubeSubscribe
TiktokFollow
- Advertisement -
Ad image

Đang được quan tâm

Indonesia phát hiện hợp chất mới chống ung thư

Nhà nghiên cứu Indonesia tìm thấy hợp chất chống ung thư cổ tử cung trong…

By Cafe Bệt

Rất quen mặt với người Việt

Theo thông tin từ Bệnh viện Bạch Mai, gan nhiễm mỡ đang dần trở thành…

By Cafe Bệt

Tổng Bí thư yêu cầu sửa chính sách tiền lương cán bộ, công chức phù hợp với mô hình mới

Tổng Bí thư Tô Lâm yêu cầu tiếp tục rà soát, sửa đổi, bổ sung…

By Cafe Bệt

Tin liên quan

Công Nghệ

Lạm phát là gì mà khiến tiền trong túi tự dưng “bốc hơi”?

By Cafe Bệt
Công Nghệ

Khoa học sáng chế ra máu nhân tạo dạng bột, làm từ máu hiến đã hết hạn sử dụng

By Cafe Bệt
Công Nghệ

ChatGPT hồn nhiên tick vào ô “Tôi không phải robot”

By Cafe Bệt
Công Nghệ

Trong chưa đầy 20 năm, Trái đất đã nghiêng 80cm, nguyên nhân nằm ngay dưới mặt đất của chúng ta

By Cafe Bệt
Go to mobile version
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?