Hãy tưởng tượng bạn đang ghi hình một buổi biểu diễn ngoài phố, nhưng tiếng còi xe lại át hết âm nhạc — hoặc quay vlog trong một quán cà phê mà tiếng ồn xung quanh khiến hội thoại gần như không thể nghe được.
Audio Eraser, được giới thiệu trên dòng Galaxy S25, được thiết kế để xử lý những tình huống như vậy bằng cách giảm tiếng ồn nền không mong muốn và tăng cường âm thanh cần làm nổi bật, giúp người dùng tạo ra các video sống động hơn. Các tính năng Galaxy AI như Audio Eraser — được phát triển dựa trên sự thấu hiểu sâu sắc nhu cầu người dùng .
Trang Samsung Newsroom đã có buổi trò chuyện cùng các chuyên gia công nghệ âm thanh đến từ Đội giải pháp AI tại Samsung Research để tìm hiểu sâu hơn về quá trình phát triển tính năng đột phá này.
(Từ trái sang) Kyoungbo Min, Hejung Yang, Hosang Sung và Jiwon Kim từ Nhóm giải pháp AI tại Samsung Research
Audio Eraser cho phép người dùng điều chỉnh âm thanh trong video bằng cách loại bỏ tiếng ồn và tăng cường âm thanh mong muốn. Tính năng này quét nhanh video để phát hiện và phân loại các loại âm thanh, áp dụng được không chỉ với video do người dùng tự quay mà còn với cả video nhận được từ người khác.
Tương tự như cách Object Eraser từng cải thiện khả năng chỉnh sửa hình ảnh khi ra mắt trên Galaxy S21, Audio Eraser được phát triển để mang lại trải nghiệm đa phương tiện cao cấp và liền mạch hơn giữa hình ảnh và âm thanh.
Audio Eraser cho phép người dùng điều chỉnh từng loại âm thanh trong video.
Phát triển mô hình nhận diện và tách biệt nguồn âm
Audio Eraser có khả năng nhận diện sáu loại âm thanh: giọng nói, nhạc, tiếng gió, âm thanh thiên nhiên, tiếng ồn đám đông và tiếng ồn môi trường. Dựa vào công nghệ nhận diện nguồn âm, tính năng này nhanh chóng xác định âm thanh nào xuất hiện và ở đâu trong video. Sau đó, công nghệ tách nguồn âm sẽ phân tách và phân loại từng âm thanh vào các nhóm riêng biệt.
Để xây dựng được mô hình AI đủ khả năng nhận diện và phân tách những loại âm thanh này, nhóm nghiên cứu đã thu thập bộ dữ liệu huấn luyện lớn và đa dạng. Họ mô phỏng hàng loạt tình huống ghi hình trong thực tế để tạo ra tập dữ liệu phong phú — thậm chí còn ra thực địa để thu âm trực tiếp các âm thanh đời thường.
Các nhà nghiên cứu của Samsung đang làm việc để phát triển công nghệ âm thanh cho Audio Eraser
“Gió là một thách thức lớn,” Hejung Yang từ nhóm giải pháp AI tại Samsung Research chia sẻ. “Ngoài việc tinh chỉnh công nghệ mô phỏng tiếng gió, chúng tôi còn tăng cường dữ liệu bằng cách ghi âm tiếng gió thật mỗi khi có gió mạnh — kể cả sau giờ làm hoặc vào cuối tuần.”
Ngoài ra, nhóm cũng dành nhiều thời gian để cải thiện hiệu suất mô hình tách nguồn âm bằng cách kiểm tra thủ công hàng loạt đoạn video.
“Mỗi nhà phát triển phải so sánh và phân tích hơn 1.000 mẫu âm thanh mỗi tuần trong nhiều điều kiện khác nhau,” Jiwon Kim cho biết. “Thông qua các thử nghiệm liên tục, chúng tôi tìm ra mô hình hiệu quả nhất để đảm bảo kết quả ổn định và chất lượng cao.”
Mang đến trải nghiệm nghe lấy người dùng làm trung tâm
Vì Audio Eraser hoạt động trực tiếp trên thiết bị, nên tính năng này mang lại trải nghiệm người dùng tốt hơn với khả năng chỉnh sửa thời gian thực và tăng cường bảo mật. Năng lực lâu năm của Samsung trong phát triển AI trên thiết bị là yếu tố then chốt cho sự thành công của Audio Eraser.
“Chúng tôi tập trung phát triển các mô hình AI và thuật toán có thể xử lý nhanh trên thiết bị,” Hosang Sung cho biết. “Rất nhiều nỗ lực đã được đầu tư để tạo ra một giải pháp AI tối ưu, vận hành mượt mà với mức tiêu thụ điện năng thấp.”
Hợp tác cùng đội ngũ phát triển sản phẩm
Việc chuyển đổi nghiên cứu tiên tiến thành giải pháp dành cho người tiêu dùng cũng đặt ra nhiều thách thức mới. Ví dụ, khi chỉnh sửa đồng thời cả video và âm thanh, tính năng phát lại cần phải mượt mà, không bị gián đoạn. Ngoài ra, việc xử lý video dài hơn một tiếng đòi hỏi công nghệ chuyên biệt để hoàn tất trong thời gian tương đương.
“Chúng tôi đã phát triển nhiều thuật toán trước để thích ứng với các điều kiện phần cứng khác nhau,” Kyoungbo Min cho biết. “Thông qua các mô phỏng quy mô lớn, chúng tôi đã chuẩn bị một giải pháp có thể triển khai nhanh chóng trên mọi chipset hoặc thiết bị. Quá trình phát triển trải qua nhiều vòng điều chỉnh và cải tiến, nhưng sự hợp tác chặt chẽ giữa đội ngũ nghiên cứu và phát triển sản phẩm đã giúp rút ngắn thời gian thương mại hóa.”
Tách nguồn âm là một lĩnh vực trọng yếu trong công nghệ âm thanh thế hệ tiếp theo, và Samsung đang tiếp tục đẩy mạnh các đổi mới nền tảng trong lĩnh vực này.
Nguồn tin: https://genk.vn/cau-chuyen-dang-sau-audio-eraser-tinh-nang-galaxy-ai-dot-pha-tren-galaxy-s25-20250418202146233.chn