Đam mê và yêu thích công nghệ cũng như chia sẻ những kiến thức về công nghệ. Nếu mọi người thấy hay hãy chia sẻ bài viết của mình tới cộng đồng nhé.
Ở thời điểm hiện tại, Google đang đặt cược lớn vào Gemini, chatbot AI và mô hình ngôn ngữ lớn mới nhất của hãng, với tham vọng tích hợp sâu rộng trên toàn bộ hệ sinh thái. Gemini hiện đã có mặt trên nhiều thiết bị Android với vai trò trợ lý ảo mặc định, và liên tục được Google cập nhật tính năng mới.
Tuy nhiên, điểm yếu hiện tại của Gemini chính là khả năng tương tác hạn chế với các ứng dụng Android. Điều này được kỳ vọng sẽ thay đổi đáng kể với sự xuất hiện của Android 16 vào năm 2025, khi hệ điều hành này dự kiến sẽ giới thiệu một API mới, cho phép các dịch vụ như Gemini thực hiện các tác vụ phức tạp trong ứng dụng thay cho người dùng.
Android 16 có thể trao cho Gemini quyền kiểm soát ứng dụng
Hiện tại, Gemini tương tác với các dịch vụ bên ngoài thông qua Gemini Extensions. Cơ chế này cho phép Gemini truy cập vào các dịch vụ web như Google Flights, Google Hotels, OpenStax,… để thu thập thông tin khi người dùng yêu cầu. Các extension cũng hỗ trợ Google Maps, Google Home, YouTube và Google Workspace, tất cả đều có ứng dụng riêng ở trên Android. Tuy nhiên, thay vì trực tiếp điều khiển ứng dụng, các extension này chỉ cho phép chatbot sử dụng dữ liệu tài khoản người dùng khi gọi API backend của dịch vụ. Một số extension như Utilities cho phép Gemini tương tác trực tiếp với ứng dụng Android, nhưng chỉ giới hạn ở các thao tác đơn giản với intent được xác định trước.
Vấn đề lớn nhất của Gemini Extensions nằm ở khả năng mở rộng. Việc tạo extension cho hàng triệu ứng dụng Android là một bài toán nan giải cho Google, chưa kể nhiều ứng dụng không cung cấp API công khai. Về lý thuyết, sự kết hợp giữa công nghệ đọc màn hình, AI đa phương thức và đầu vào trợ năng (accessibility input) có thể giúp Gemini điều khiển ứng dụng Android bằng ngôn ngữ tự nhiên. Tuy nhiên, chuyên gia Mishaal Rahman cho biết, sự kết hợp này có thể không cho ra kết quả chính xác do thiếu ngữ cảnh. Do đó, ông cho rằng, giải pháp tối ưu là Google sẽ cung cấp một API cho phép ứng dụng làm việc trực tiếp với Gemini, và đó chính xác là những gì Google đang hướng tới với Android 16.
Đáng chú ý, nhóm của Android Authority đã phát hiện một loạt API mới liên quan đến tính năng “app functions” (chức năng ứng dụng) trong tài liệu dành cho nhà phát triển của Google khi Android 16 DP1 vừa mới ra mắt. Theo tài liệu của Google, chức năng ứng dụng “là một chức năng cụ thể mà ứng dụng cung cấp cho hệ thống“.Các chức năng này có thể được “tích hợp vào nhiều tính năng hệ thống khác nhau.”
Mặc dù Google chưa cung cấp nhiều thông tin chi tiết về chức năng ứng dụng, nhưng một ví dụ trong tài liệu đã hé lộ cách thức hoạt động của tính năng mới. Cụ thể, mã định danh chức năng phải là duy nhất trong mỗi ứng dụng, ví dụ “đặt thức ăn” có thể được định danh là “orderFood”. Như vậy, một ứng dụng nhà hàng có thể triển khai chức năng đặt món, hoặc ứng dụng khách sạn có thể triển khai chức năng đặt phòng.
Các ứng dụng sẽ tạo ra “chức năng” bằng cách định nghĩa một dịch vụ đặc biệt, chỉ các tiến trình hệ thống mới có thể kết nối đến. Những chức năng này được hiển thị thông qua framework App Search của Android, nền tảng hỗ trợ trải nghiệm tìm kiếm chung trên Pixel Launcher. Trong Android 16, ứng dụng muốn thực thi các chức năng này cần có quyền EXECUTE_APP_FUNCTIONS hoặc EXECUTE_APP_FUNCTIONS_TRUSTED.
Điều thú vị nằm ở chỗ, các app functions này có thể được kích hoạt bởi các ứng dụng sở hữu quyền đặc biệt: EXECUTE_APP_FUNCTIONS hoặc EXECUTE_APP_FUNCTIONS_TRUSTED. Ứng dụng Google, với vai trò ASSISTANT, sở hữu quyền EXECUTE_APP_FUNCTIONS, qua đó gián tiếp trao quyền kiểm soát ứng dụng cho Gemini. Tuy nhiên, các nhà phát triển ứng dụng có toàn quyền quyết định, họ có thể giới hạn quyền truy cập app functions, chỉ cho phép các ứng dụng có quyền EXECUTE_APP_FUNCTIONS_TRUSTED, như Android System Intelligence, mới có thể kích hoạt chúng.
Chiến lược này của Google gợi nhớ đến màn ra mắt “Trợ lý Google mới” hồi năm 2019, với khả năng điều phối đa nhiệm trên nhiều ứng dụng. Tuy nhiên, tham vọng lần này của hãng dường như lớn hơn nhiều so với thời điểm năm 2019. Google không chỉ muốn Gemini thực hiện các tác vụ đơn lẻ, mà còn muốn nó có thể điều khiển toàn bộ trải nghiệm người dùng trên Android.
Theo: Android Authority