Cafe Bệt

Nhịp sống trẻ mỗi ngày

Font ResizerAa
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Font ResizerAa

Cafe Bệt

Nhịp sống trẻ mỗi ngày

Search
  • Thời Sự
  • Đời Sống
    • Góc Nhìn
  • Nhịp Sống Trẻ
    • Cơ Hội
    • Sự Kiện
    • Giải Trí
    • Cuộc Thi
  • Kiến Thức
    • Tài Chính
  • Kỹ Năng Sống
    • Sống Đẹp
  • Tuyển Dụng
  • Doanh Nghiệp
  • Công Nghệ
  • Thể Thao
Have an existing account? Sign In
Follow US
© 2026 Cafe Bệt. All Rights Reserved.
Cafe Bệt > Blog > Công Nghệ > biến bất kỳ ai thành ca sĩ chỉ với một hình ảnh duy nhất, tái tạo chính xác biểu cảm gương mặt và cử động môi
Công Nghệ

biến bất kỳ ai thành ca sĩ chỉ với một hình ảnh duy nhất, tái tạo chính xác biểu cảm gương mặt và cử động môi

Last updated: 12/03/2024 3:03 pm
Cafe Bệt
Share
SHARE

Công nghệ AI tạo sinh đang tiến nhanh hơn hình dung của đa số mọi người. Nếu hơn một năm trước ChatGPT vẫn còn đang khiến người dùng kinh ngạc vì khả năng tạo ra nội dung văn bản theo yêu cầu thì giờ đây những nội dung mà các mô hình AI tạo ra đã vượt xa về mức độ phức tạp và tinh xảo.

Cách đây không lâu, hãng OpenAI đã giới thiệu mô hình Sora với khả năng tạo ra các đoạn video ngắn từ các lời nhắc văn bản với chất lượng chân thực như các đoạn clip chuyên nghiệp. Giờ đây, hãng Alibaba của Trung Quốc cũng đưa ra câu trả lời của mình: một mô hình AI có khả năng biến bất kỳ nhân vật nào trong một hình ảnh tĩnh thành ca sĩ chuyên nghiệp.

Chỉ bằng một bức ảnh, cô gái trong clip giới thiệu Sora đã hóa thân thành ca sĩ Dua Lipa

Công cụ tạo video AI này có tên EMO, viết tắt của Emotive Portrait Alive, đại diện cho một bước tiến đột phá trong lĩnh vực này, được thiết kế để giúp vượt mặt Sora của OpenAI. Trong khi Sora xuất sắc trong việc tạo ra các cảnh quan và phong cảnh ngoạn mục, các nhân vật của nó thường im lặng và bất động. Ngược lại, EMO giúp cho phép nhân vật nói và hát, thể hiện các biểu cảm khuôn mặt chân thực và khả năng đồng bộ môi chính xác – ngay cả khi đó là một nhân vật ảo không có thật như cô gái trong clip giới thiệu Sora của OpenAI.

Dù trong clip của Sora, cô gái chỉ đang đi dạo quanh Tokyo và không hề có chuyển động môi, nhưng cô vẫn có thể hát và nhảy tương tự như ca sĩ Dua Lipa trong bài hát “Don’t Start Now”.

Một demo khác cho thấy cách EMO có thể khiến nữ diễn viên danh tiếng Audrey Hepburn nhái lại bài hát của Ed Sheeran, không chỉ cả phần âm thanh mà còn cả biểu cảm gương mặt.

Không chỉ có thể nhái lại biểu cảm gương mặt mà ngay cả các chuyển động môi phức tạp như trong một bài rap của Eminem cũng được Leonardo DiCaprio bắt chước giống hệt như thật.

Thậm chí ngay cả biểu cảm của diễn viên Heath Ledger trong vai Joker năm 2008 cũng được tái hiện trên gương mặt của diễn viên Joaquin Phoenix – người cũng đóng vai Joker trong bộ phim cùng tên năm 2019.

Nếu như kỹ thuật deepfake xuất hiện vài năm trước chỉ đơn thuần là việc hoán đổi gương mặt bằng AI nhưng không tái hiện được biểu cảm gương mặt cũng như phải cần đến các clip cho trước, thì EMO chỉ cần một hình ảnh tĩnh duy nhất. Không chỉ tiếng Anh, mô hình AI này có thể tạo ra nhân vật với các ngôn ngữ, giọng điệu khác nhau như tiếng Hàn.

Công cụ Tạo Video AI của Alibaba hoạt động như thế nào

Theo tài liệu nghiên cứu của Alibaba, EMO sử dụng một tập dữ liệu lớn về âm thanh và video để học cách thực hiện các biểu cảm khuôn mặt một cách chân thực. Nó cũng sử dụng một phương pháp dựa trên sự khuếch tán, có nghĩa là nó dần dần chuyển đổi hình ảnh tĩnh thành video từng khung hình một, không qua bất kỳ bước trung gian nào.

EMO cũng sử dụng hai cơ chế tìm điểm chú ý, một cho hình ảnh tham khảo và một cho âm thanh, để đảm bảo rằng hoạt ảnh khuôn mặt phù hợp với cả vẻ ngoài và lời nói của khuôn mặt mục tiêu. Kết quả là một video mượt mà và biểu cảm, trông giống như người thật đang nói hoặc hát.

Trong khi các công cụ, mô hình AI đang phát triển nhanh như vũ bão hiện nay, mở ra các cơ hội hấp dẫn cho lĩnh vực như giải trí, giáo dục và giao tiếp. Hãy tưởng tượng việc khai thác sức mạnh để làm cho các nhân vật nổi tiếng hoặc những nhân vật lịch sử nói hoặc hát bất cứ điều gì bạn mong muốn, hoặc tạo ra những hình đại diện ảo không chỉ giống bạn mà còn nghe như bạn. Những khả năng mà các công cụ tạo video AI như EMO mang lại thực sự đáng kinh ngạc và có tiềm năng lớn trong việc biến đổi các ngành công nghiệp giải trí đa dngj.

Tuy nhiên, EMO cũng đặt ra một số mối quan ngại về đạo đức và xã hội, đặc biệt là liên quan đến quyền riêng tư và sự đồng ý của những người có khuôn mặt được hệ thống sử dụng. EMO có thể được sử dụng để tạo ra các video giả mạo hoặc gây hiểu lầm có thể làm hại đến uy tín hoặc độ tin cậy của các cá nhân liên quan, hoặc để thao túng cảm xúc hoặc quan điểm của người xem.

Nhưng đồng thời đây cũng là một lưỡi dao hai lưỡi có thể mang lại hậu quả tích cực hoặc tiêu cực tùy thuộc vào cách nó được sử dụng. Cũng tương tự như những gì deepfake đang làm hoang mang cho mọi người, EMO và các công nghệ tạo sinh hình ảnh và video hiện tại cũng có thể gây ra các tác hại tương tự với ảnh hưởng lớn hơn nhiều.


Nguồn tin: https://genk.vn/kinh-ngac-voi-ai-moi-cua-alibaba-bien-bat-ky-ai-thanh-ca-si-chi-voi-mot-hinh-anh-duy-nhat-tai-tao-chinh-xac-bieu-cam-guong-mat-va-cu-dong-moi-20240312141527213.chn

Share This Article
Email Copy Link Print
Previous Article Hố ‘tử thần’ không đáy đe dọa khu dân cư
Next Article 5 loại trái cây ít calo, dễ tìm cho ai muốn giảm mỡ bụng

Nhịp sống trẻ mỗi ngày!

Cùng cập nhật những tin tức nóng hổi, đa dạng về kinh tế, xã hội, văn hóa và giải trí. Đón nhận nhịp sống trẻ, năng động, và sáng tạo mỗi ngày.
FacebookLike
XFollow
PinterestPin
InstagramFollow
YoutubeSubscribe
TiktokFollow
- Advertisement -
Ad image

Đang được quan tâm

Lợi suất trái phiếu chính phủ Nhật Bản tăng vọt, nhà đầu tư Nhật có thể ồ ạt rút vốn về nước

Lợi suất trái phiếu chính phủ Nhật Bản (JGB) tăng lên mức cao nhất trong…

By Cafe Bệt

Mỹ áp thuế hơn 100% lên một mặt hàng của Việt Nam, lãnh đạo Bộ Công Thương chỉ ra vấn đề thật sự

Thị trường Mỹ tiếp tục mở ra nhiều cơ hội nhưng cũng đi kèm các…

By Cafe Bệt

Thông tư 08: Cú hích chính sách cho nhóm ngân hàng quốc doanh

MBS đánh giá Thông tư 08 sẽ giúp gia tăng dư địa cho vay của…

By Cafe Bệt

Tin liên quan

Công Nghệ

Hóa ra AI có thể bị “mục não” như con người khi xem quá nhiều TikTok

By Cafe Bệt
Công Nghệ

Sony sắp ra mắt cảm biến 200MP cạnh tranh với Samsung, đã có 2 “khách sộp” Vivo và OPPO

By Cafe Bệt
Công Nghệ

Microsoft phát cảnh báo đến người dùng vẫn chưa chịu rời Windows 10

By Cafe Bệt
Công Nghệ

Video AI gây lo ngại

By Cafe Bệt
Go to mobile version
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?