Sau ngày đầu tiên của WWDC24 kết thúc, tôi đã được Apple mời xem demo trực tiếp các khả năng của Apple Intelligence để có cái nhìn rõ hơn về những gì AI này có thể làm được.
Đầu tiên, chúng ta hãy tóm tắt sơ lược về Apple Intelligence và điểm khác biệt giữa nó và các AI khác. Apple Intelligence là mô hình AI mà nhà Táo tự đào tạo, phát triển và tinh chỉnh, không phải dựa trên Google Gemini hay OpenAI ChatGPT như Galaxy AI và Copilot.
Do đó Apple có thể tích hợp Apple Intelligence rất sâu và xuyên suốt các nền tảng của họ từ iOS, iPadOS đến macOS, công ty cũng tạo ra Private Cloud Compute để giải quyết các tác vụ AI cần đến máy chủ một cách bảo mật. Tất cả nhằm đảm bảo tạo ra một trí thông minh nhân tạo vừa đáp ứng khả năng cá nhân hóa, vừa đảm bảo quyền riêng tư. Đây là điều giúp Apple Intelligence trở nên độc đáo và thật sự thì các công ty khác sẽ không dễ thực hiện được một AI tương tự nếu không nắm trong tay quyền kiểm soát cả phần mềm và phần cứng như Apple.
Apple Intelligence có thể làm gì?
Quay trở lại về demo mà tôi được xem, trong WWDC, công ty đã nói về áp dụng Apple Intelligence trong các tính năng chỉnh sửa ảnh, đặc biệt là công cụ Clean Up mới có thể nhận diện và loại bỏ các đối tượng không mong muốn trong nền của ảnh mà không làm thay đổi chủ thể. Công bằng mà nói thì những AI khác như Galaxy AI cũng đã hỗ trợ khả năng loại bỏ vật thể không mong muốn ra khỏi ảnh, nhưng những gì Apple làm vẫn khiến tôi phải bất ngờ.
Có 2 trường hợp tôi được xem: Tấm ảnh đầu tiên là nhóm 4 người chụp chung và bị lẫn 1 người ngoài đang quay lưng ở background, sau khi chọn tính năng Clean up thì máy tự động phát hiện vật thể cần “dọn dẹp”, chỉ việc nhấn Apply là chưa đến 1 giây đã xử lý xong, nhanh hơn nhiều so với Generative Edit trên Galaxy AI. Tôi rất bất ngờ vì nghĩ rằng nó sẽ hiện các thông báo xử lý, hay ít nhất là phải hiển thị vòng tròn loading, nhưng không, khi bấm Apply là mọi thứ đã xong! Đó là cú “há hốc mồm” đầu tiên của tôi và những đại diện truyền thông các nước khác tại buổi demo này.
Tấm ảnh thứ 2 là dùng tay khoanh tròn vật cần xoá trong ảnh, và khi vừa thả tay ra khỏi màn hình thì ảnh cũng đã xoá xong… Một lần nữa, tốc độ thực hiện của AI này quả thật quá nhanh. Thú thật là tôi và những người được xem demo hôm ấy đều có một cảm nghĩ chung: Khi xem giới thiệu trên sân khấu cứ nghĩ nó cũng phải tốn vài giây như bao thiết bị khác (như Galaxy AI chẳng hạn), nhưng với Apple thì không tốn giây nào. Liệu rằng AI của Apple đã học đi học lại bối cảnh này để xử lý nhanh hơn, hay thực sự nó đều có thể xử lý nhanh tất cả mọi tấm ảnh như vậy?
Và cũng từ giây phút xem được phần demo này, tôi chợt nghĩ liệu rằng Apple chỉ cho hỗ trợ từ iPhone 15 Pro/ProMax mà bỏ qua phiên bản thường cũng là vì muốn Apple Intelligence của họ xử lý một cách nhanh nhất và vì họ muốn người dùng có được trải nghiệm tối ưu nhất?
Tạm bỏ qua chút suy nghĩ đó, người thực hiện demo đã tiếp tục trình diễn cho chúng tôi xem tính năng tạo một Memory Movie trong Photos. Người làm demo ra lệnh cho Apple Intelligence với một lệnh như: “Tạo một video với những bức ảnh tôi leo núi cùng bạn A trong những năm qua, đặc biệt thêm những ảnh selfie ở cuối”, hay như trong hội nghị WWDC là “Tạo video Leo học câu cá và câu được con cá lớn”. Chỉ trong một thời gian ngắn, AI của Apple đã lục lọi hết cơ số ảnh và đưa ra video với những layout rất đẹp mắt.
Về cơ bản, trước đây tính năng này đã có trên Photos, nó tự học và tự gom thông tin để đề xuất những video kỷ niệm. Nhưng bây giờ Apple Intelligence đã nâng nó lên một tầm cao mới, người dùng tự đưa những yêu cầu mà họ muốn, với những người cụ thể trong ảnh. Tất nhiên khuôn mặt của những người đó phải được chúng ta gán từ trước và sau này các ảnh có thêm thì Photos trong iOS cũng sẽ tự nhận diện.
Nhờ được tích hợp rất sâu vào hệ điều hành mà Apple Intelligence có thể sử dụng các dữ liệu này để tạo ra video mang tính cá nhân hóa chỉ thông qua những câu lệnh hết sức tự nhiên.
Những tác vụ như thế này sẽ được xử lý trên thiết bị, người dùng không lo bị lộ thông tin ra ngoài.
Tại WWDC24, Apple cũng cho biết sẽ nâng cấp bộ phát triển phần mềm (SDK) cho các nhà phát triển để họ dễ dàng tích hợp Apple Intelligence và sản phẩm của mình. Điều này mở ra những cách sử dụng AI cực kỳ thú vị ngay cả trong các ứng dụng bên thứ ba. Một ví dụ Apple đưa ra trong WWDC là ứng dụng chỉnh sửa ảnh Darkroom, sau khi được tích hợp Apple Intelligence, người dùng chỉ cần ra lệnh cho Siri như “Áp filter kiểu phim ảnh cho bức hình tôi chụp anh bạn Ian ngày hôm qua”, và ứng dụng sẽ thay bạn thực hiện mọi bước từ chọn ảnh đến chỉnh sửa.
Genmoji cũng là một tính năng mà bên thứ ba có thể tích hợp lên ứng dụng của họ thông qua API chuyên dụng. Genmoji là tính năng tạo emoji độc đáo bằng câu lệnh, nó nằm ngay trong khu tìm kiếm emoji, rất tiện lợi, bạn chỉ cần tìm và ra lệnh theo ý mình, nó sẽ tự động tạo cho bạn.
Image Playground cũng có API, tính năng này cho phép tạo hình ảnh vui nhộn trong vài giây, chọn từ các phong cách như Hoạt hình, Minh hoạ, hoặc Phác thảo. Người dùng có thể tạo hình ảnh từ mô tả và tùy chỉnh theo sở thích cá nhân. Image Playground có giao diện dễ dùng, dễ hiểu để người dùng không phải lo lắng đến việc gì khác mà chỉ cần thoải mái sáng tạo trong việc tạo câu lệnh, nhìn chung là thỏa thích vui chơi, có vẻ rất hợp với các bạn trẻ nhỏ. Bạn càng tạo nhiều thì lịch sử tạo ảnh vẫn còn ở đó để có thể quay lại bản phía trước.
Một tính năng đáng chú ý nữa là Image Wand, nếu Google và Samsung có tính năng Circle to Search, khoanh tròn để tìm kiếm dựa trên những hình ảnh trên màn hình, thì Image Wand thoạt nhìn giống như là phiên bản đảo ngược, bạn có thể khoanh tròn để tạo ra một hình ảnh đẹp mắt từ các nét vẽ phác thảo hoặc thậm chí từ nội dung văn bản trong ứng dụng Notes. Theo Apple thì tính năng sẽ rất giúp ích cho các nhà sáng tạo nội dung, hoặc thiết kế, để họ có thể nhanh chóng xem thử ý tưởng của mình sẽ như thế nào chỉ bằng cách mô tả hoặc vẽ phác thảo.
Siri “tái sinh”
Tuy Apple có thể được xem là người dẫn đầu trong việc tích hợp trợ lý ảo vào smartphone, nhưng trong những năm qua Siri đã bị các đối thủ bỏ xa. Apple Intelligence đã thổi một luồng gió mới vào trợ lý này và giúp nó trở nên hữu ích hơn rất nhiều.
Trong demo mà tôi được xem, Siri giờ đã hiểu được ý người dùng như một trợ lý thực thụ, ví dụ bạn ra lệnh “đặt báo thức cho tôi vào 6h, à mà thôi 5:45 đi. Là nó tự nhận 5:45.” Ra lệnh trên Siri giờ đây có thể nhận được nhiều câu phức tạp hơn, nhiều vế hơn chứ không cần vế câu đơn giản nữa.
Nhờ được tích hợp sâu vào hệ điều hành, người dùng cũng có thể hỏi Siri về những hướng dẫn sử dụng máy, tính năng này khá hữu dụng cho những ai không quá rành về công nghệ, đặc biệt là người cao tuổi, ví dụ như bạn hỏi Siri cách hẹn giờ gửi tin nhắn hoặc gửi tin nhắn ẩn, nó sẽ đưa ra cách thực hiện rất nhanh trong vòng chưa đến 1 giây.
AI của Apple có thể dễ dàng sàng lọc qua email và tin nhắn trên máy (và sau đó sẽ là nhiều ứng dụng khác từ bên thứ ba thông qua các API chuyên dụng) để tìm câu trả lời mà nó cần. Công ty có thể truy cập vào một lượng thông tin đáng kinh ngạc để tạo ra các câu trả lời được cá nhân hóa theo cách mà những AI khác không thể nào làm theo.
Người dùng có thể hỏi về Siri bộ phim mà đứa bạn A gợi ý nên xem khi nhắn tin qua lại cách đây 1 tháng. Siri sẽ tự lục trong các ứng dụng nhắn tin hay email của chúng ta để đưa kết quả.
Tương tự là demo về chuyến bay trong WWDC của Kelsey Peterson, giám đốc mảng Machine Learning và AI tại Apple. Peterson hỏi “Siri, khi nào chuyến bay của mẹ tôi đáp” và không chỉ đơn giản là đưa ra câu trả lời, Siri đã tham khảo chéo các chuyến bay tìm thấy trong email, sau đó theo dõi chuyến bay trực tuyến để điều chỉnh lịch đáp nếu có delay. Tiếp theo, khi hỏi Siri về kế hoạch ăn trưa, dù Peterson không thêm vào ứng dụng ghi chú nhưng Siri vẫn tìm thấy nơi dùng bữa được người mẹ gửi trong một tin nhắn văn bản. Sau đó, khi được hỏi “Sẽ mất bao lâu để chúng tôi đến đó từ sân bay?” một bản đồ bật lên với thông tin về tình trạng giao thông.
Và dù có vẻ hơi muộn, nhưng giờ bạn có thể ra lệnh cho Siri bằng cách gõ văn bản thay vì phải thông qua giọng nói, vì trong nhiều tình huống muốn đảm bảo riêng tư, chính xác (môi trường xung quanh có tiếng ồn) hoặc tránh làm phiền người khác, thì văn bản vẫn là lựa chọn tối ưu hơn. Người dùng chỉ cần chạm hai lần vào vùng cuối màn hình chính hoặc màn hình khóa, hoặc cả trong ứng dụng khác, để mở Siri với dạng gõ văn bản.
Khi có những thứ vượt quá khả năng của Siri (thường sẽ là những câu hỏi theo kiểu cần tổng hợp thông tin trên Internet) thì nó sẽ gọi ChatGPT và khi đó sẽ hỏi ý bạn có muốn gửi thông tin mình cần tìm này đến ChatGPT không, cho phép thì mới chuyển tiếp đi. Chúng ta có thể nghĩ Siri không chỉ là thư ký, mà còn là người đưa thư, chuyển thông tin sang GPT trong tích tắc khi có sự cho phép của bạn.
Liệu Apple Intelligence có là nhân tố thay đổi cuộc chơi AI?
Chúng ta đã thấy hàng loạt máy tính AI tại các sự kiện như CES và Computex, cũng như AI đang len lỏi trong các smartphone Samsung, Google, nhưng đó là trên các nền tảng khác nhau. Với hệ sinh thái phần cứng và phần mềm của riêng mình, Apple Intelligence được tích hợp xuyên suốt trên các hệ điều hành và ứng dụng của công ty, tạo nên một lợi thế lớn so với những đối thủ trước đó.
Không chỉ như vậy, Apple còn đang cho thấy họ rất sẵn sàng hỗ trợ các nhà phát triển bên thứ ba tích hợp Apple Intelligence vào sản phẩm của mình. Suy cho cùng, đích đến của cuộc đua AI rõ ràng không chỉ xoay quanh phần cứng mà phần mềm và ứng dụng là rất quan trọng, đó là thứ mà người dùng trực tiếp sử dụng.
Tất nhiên, chúng ta còn phải đợi sau khi Apple Intelligence chính thức ra phát hành mới biết được khả năng thật sự của nó. Nhưng nếu Apple tiếp tục thực hiện các cam kết về bảo mật và cá nhân hóa mà họ đưa ra tại WWDC24, thì chúng ta có thể thấy cuộc đua AI sắp có những biến động lớn.
Nguồn tin: https://genk.vn/apple-intelligence-co-lam-thay-doi-cuoc-choi-ai-20240616091120628.chn