Tác giả: Sissie Hsiao, Phó Giám đốc, phụ trách Google Trợ lý
Tương tự như những phụ huynh bận rộn khác, tôi luôn tìm nhiều cách khiến cho cuộc sống hàng ngày dễ dàng hơn một chút. Và chính Google Trợ lý hỗ trợ tôi việc đó - từ việc cung cấp cho tôi hướng dẫn nấu ăn khi tôi chuẩn bị bữa tối cho gia đình đến việc cập nhật tình hình giao thông trên đường đi đến văn phòng. Google Trợ lý cho phép tôi hoàn thành nhiều việc hơn khi ở nhà và khi di chuyển, vì vậy tôi có thể dành thời gian giải quyết những việc thực sự quan trọng.
Mỗi tháng, có hơn 700 triệu người trên khắp thế giới hoàn thành công việc hàng ngày với Google Trợ lý của họ. Giọng nói đã trở thành một trong những phương thức chính để chúng ta tương tác với thiết bị của mình. Nhưng chúng tôi biết rằng bạn có thể cảm thấy không tự nhiên khi nói “Hey Google'' hoặc chạm vào thiết bị của mình mỗi khi bạn muốn yêu cầu trợ giúp. Vì vậy, hôm nay, chúng tôi sẽ giới thiệu những phương thức mới để tương tác với Trợ lý của bạn một cách tự nhiên hơn — giống như khi bạn đang trò chuyện với một người bạn.
Bắt đầu cuộc trò chuyện
Tính năng mới đầu tiên của chúng tôi, Look and Talk (tạm dịch: Nhìn và Nói), hiện đã ra mắt tại Mỹ trên Nest Hub Max. Khi bạn chọn sử dụng tính năng này, bạn có thể chỉ cần nhìn vào màn hình và yêu cầu những gì bạn cần. Ngay từ đầu, chúng tôi xây dựng tính năng Look and Talk với lưu ý bảo vệ quyền riêng tư của bạn. Tính năng này được thiết kế kích hoạt để khi bạn sử dụng thì cả Face Match và Voice Match đều nhận ra đó là bạn. Và video từ những tương tác này được xử lý hoàn toàn chỉ trên thiết bị, vì thế nó sẽ không chia sẻ với Google hay bất kỳ ai. Giả sử tôi cần sửa bồn rửa bị rỉ nước của mình. Khi bước vào phòng, tôi có thể chỉ cần nhìn vào Nest Hub Max của mình và nói “Tìm thợ sửa ống nước gần tôi” - mà không cần phải nói “Hey Google” trước.
Có rất nhiều thứ hoạt động đằng sau để nhận ra liệu bạn có đang thực sự giao tiếp bằng mắt với thiết bị của mình hay không thay vì chỉ nhìn lướt qua thiết bị. Trên thực tế, cần sáu mô hình học máy để xử lý hơn 100 tín hiệu từ cả máy ảnh và micrô - như khoảng cách, hướng đầu, hướng nhìn, chuyển động môi, nhận thức ngữ cảnh và phân loại ý định - tất cả đều hoạt động trong thời gian thực.
Chúng tôi cũng đã thử nghiệm và tinh chỉnh tính năng Look and Talk để phù hợp với nhiều tông màu da. Chúng tôi đã sử dụng các nguyên tắc hòa hợp tương tự đằng sau Real Tone, một nỗ lực của chúng tôi nhằm xây dựng trải nghiệm công bằng hơn trên máy ảnh Pixel 6.
Chúng tôi cũng đang mở rộng các câu lệnh nhanh trong Nest Hub Max, cho phép bạn bỏ qua việc nói “Hey Google” đối với một số công việc hàng ngày quen thuộc nhất của bạn. Vì vậy, ngay khi bước qua cửa, bạn chỉ cần nói “Bật đèn hành lang” hoặc “Đặt hẹn giờ trong 10 phút”. Các câu lệnh nhanh cũng được thiết kế với lưu ý về quyền riêng tư của bạn. Nếu bạn quyết định sử dụng tính năng này, bạn sẽ quyết định kích hoạt những câu lệnh nào và chúng sẽ hoạt động khi tính năng Voice Match nhận ra đó là bạn.
Hiện thực hóa cuộc trò chuyện tự nhiên hơn với Google Trợ lý trong tương lai
Trong cuộc trò chuyện hàng ngày, tất cả chúng ta đều nói “ừm” một cách tự nhiên và thỉnh thoảng tạm dừng để tìm những từ thích hợp. Nhưng những người khác vẫn có thể hiểu chúng ta, bởi vì con người đều là những người lắng nghe tích cực và có thể phản ứng với các tín hiệu trò chuyện trong vòng dưới 200 mili giây. Chúng tôi tin rằng Google Trợ lý của bạn cũng có thể lắng nghe và hiểu bạn như vậy.
Để hiện thực hóa điều này, chúng tôi đang xây dựng các mô hình ngôn ngữ và giọng nói mới mạnh mẽ hơn có thể hiểu các sắc thái nói chuyện của con người - như khi ai đó đang tạm dừng nhưng chưa nói xong. Và chúng tôi đang tiến gần hơn đến tính linh hoạt của cuộc trò chuyện trong thời gian thực với chip Tensor, được thiết kế riêng để xử lý cực kỳ nhanh các tác vụ máy học trên thiết bị. Sắp tới, Google Trợ lý sẽ có thể hiểu rõ hơn về những điểm chưa hoàn hảo trong lời nói của con người mà không gặp trở ngại gì - bao gồm cả những đoạn tạm dừng, “ừm” và gián đoạn - giúp cho các tương tác của bạn cùng với Google Trợ lý gần giống với một cuộc trò chuyện tự nhiên hơn.
Chúng tôi đang nỗ lực khiến Google Trợ lý trở thành công cụ đắc lực giúp bạn hoàn thành công việc hàng ngày ở nhà, trên ô tô và khi đang di chuyển. Và với những cải tiến mới nhất này, chúng ta đang tiến gần hơn đến một thế giới nơi bạn có thể dành ít thời gian hơn để suy nghĩ về công nghệ, và có nhiều thời gian trải nghiệm cuộc sống thật hơn trong hiện tại.
Bài viết này rất hữu ích. Nên có 1 trợ lý trong tương lai như vậy đễ hỗ trợ người dùng trong việc lựa chọn nhà cái uy tín nhất Việt Nam . Xin cảm ơn!
Trả lờiXóa