Google Gemini cải thiện trải nghiệm lướt web cho người khiếm thị và khiếm thính
Google đang từng bước đưa trí tuệ nhân tạo Gemini trở thành người bạn đồng hành đắc lực cho người dùng có vấn đề về thị giác và thính giác, đặc biệt trên các thiết bị Android. Những nâng cấp mới trong năm 2024 mang đến khả năng tương tác thông minh hơn, từ việc mô tả hình ảnh chi tiết đến hỗ trợ giao tiếp tự nhiên và nâng cao trải nghiệm duyệt web.
Trợ lý thông minh cho người khiếm thị: Gemini kết hợp TalkBack
Từ lâu, Android đã hỗ trợ tính năng đọc màn hình TalkBack – một công cụ giúp người khiếm thị hiểu nội dung hiển thị trên điện thoại và điều khiển bằng giọng nói. Tuy nhiên, vào năm 2024, Google đã tích hợp thêm trí tuệ nhân tạo Gemini vào hệ thống này, mang lại khả năng mô tả hình ảnh chi tiết và trực quan hơn.
Giờ đây, người dùng không chỉ nhận được mô tả cơ bản mà còn có thể đặt câu hỏi tương tác trực tiếp về hình ảnh. Ví dụ, nếu bạn được bạn bè gửi ảnh cây đàn guitar mới, Gemini có thể mô tả loại đàn, màu sắc và thậm chí là những vật thể khác có trong ảnh.
Tính năng Describe Screen – “Mắt thần” AI của TalkBack
Trong menu TalkBack, Google đã thêm tính năng Describe Screen (Mô tả màn hình), cho phép Gemini quét toàn bộ màn hình và đưa ra các mô tả cũng như trả lời câu hỏi liên quan.
Ví dụ:
-
“Chiếc váy nào phù hợp nhất để đi chơi đêm mùa đông?”
-
“Loại sốt nào hợp với bánh sandwich trong ảnh?”
Gemini có khả năng phân tích toàn bộ nội dung hiển thị, cung cấp thông tin chi tiết về sản phẩm, kiểu dáng, màu sắc và thậm chí cả giảm giá đang áp dụng, giúp người dùng khiếm thị mua sắm dễ dàng hơn.
Tăng trải nghiệm cho người khiếm thính: Caption sinh động và Zoom chữ thông minh
Expressive Captions – Phụ đề biểu cảm
Trên trình duyệt Chrome, Google cải thiện phụ đề tự động (auto captions) bằng công nghệ Expressive Captions (Phụ đề biểu cảm). Tính năng này không chỉ đơn thuần chuyển lời nói thành văn bản mà còn truyền tải cảm xúc, ví dụ:
-
Bình luận viên hô “Goal!” sẽ hiển thị thành “Goooaaal!” – tạo cảm giác sôi động như người đang xem.
-
Phụ đề sẽ bao gồm âm thanh phụ như: tiếng huýt sáo, tiếng cổ vũ, hoặc cả tiếng hắng giọng của người nói.
Tính năng này sẽ khả dụng trên Android 15 trở lên, tại các quốc gia: Mỹ, Anh, Canada và Úc.
Adaptive Text Zoom – Phóng to chữ mà không vỡ bố cục
Trình duyệt Chrome cũng nhận được cải tiến mới với tính năng Adaptive Text Zoom (Phóng to văn bản thích ứng). Người dùng có thể:
-
Phóng to văn bản mà không ảnh hưởng đến bố cục trang web.
-
Dễ dàng tùy chỉnh mức zoom bằng thanh trượt ở cuối trang.
-
Lưu lại thiết lập cho toàn bộ trang web hoặc từng trang cụ thể.
Kết luận
Những nâng cấp mới từ Google Gemini, TalkBack và Chrome không chỉ là bước tiến về công nghệ, mà còn là cam kết mang đến một thế giới số hòa nhập và tiện lợi hơn cho tất cả mọi người – kể cả những ai gặp khó khăn về thị giác hay thính giác.
Nếu bạn hoặc người thân đang sử dụng Android, đừng quên bật thử các tính năng mới này để trải nghiệm sự khác biệt mà trí tuệ nhân tạo mang lại!
Xem nhiều nhất
Điện thoại bị nổi quảng cáo liên tục nên khắc phục thế nào
676,493 lượt xem3 cách sửa file PDF bạn không thể bỏ qua - Siêu dễ
461,464 lượt xemMẹo khắc phục điện thoại bị tắt nguồn mở không lên ngay tại nhà
242,057 lượt xemCách xoá đăng lại trên TikTok (và tại sao bạn nên làm như vậy)
217,395 lượt xemLý giải vì sao màn hình cảm ứng bị liệt một phần và cách khắc phục
197,299 lượt xem
Thảo luận
Chưa có thảo luận nào về Bài viết Google Gemini cải thiện trải nghiệm lướt web cho người khiếm thị và khiếm thính