Il nuovo esperimento di Google Nest Hub annulla la hotword vocale "Hey Google"

451

Ecco un interessante esperimento che Google sta conducendo sui suoi display intelligenti: input del comando vocale senza hotword. Un video che descrive in dettaglio la funzione è disponibile su YouTube da Jan Boromeusz, un hacker di Nest Home che ha una comprovata esperienza nel segnare le prime funzionalità di smart display prima che vengano annunciate.

Il Nest Hub Max di Boromeusz è in qualche modo in modalità "Dogfood", il che significa che riceve build iniziali e non pubbliche del software di visualizzazione intelligente destinato solo all'uso interno di Google. Un menu speciale chiamato "Funzioni sperimentali" elenca una funzione "Acciaio blu" che consentirà al dispositivo di rispondere ai comandi senza dover prima pronunciare la hotword "Ehi Google": devi solo pronunciare un comando e lui risponderà. Boromeusz dice che il dispositivo ascolterà i comandi dopo "aver rilevato la presenza", quindi se qualcuno è davanti al display, inizierà a rispondere alle domande.

Oggi l'hardware di comando vocale di Google ascolta tutto il tempo, ma solo per la hotword "Hey Google". Una volta rilevato, inizierà a elaborare comandi aggiuntivi. Le implementazioni più moderne utilizzano anche la hotword come punto di interruzione per la connessione a Internet: il rilevamento di "Hey Google" viene elaborato localmente e qualsiasi cosa dopo verrà caricata, elaborata e archiviata sui server di Google. L'hotword funge anche da forma di consenso, non solo facendo caricare su Internet le seguenti parole, ma anche perché lasciare che il dispositivo ascolti in continuazione e risponda a ogni possibile cosa che potrebbe essere interpretata come un comando sarebbe fastidioso.

Annuncio pubblicitario

Pillole pazze?

Non è chiaro come venga rilevata la "presenza" per la funzione Blue Steel. Sulla parte anteriore dell'Home Hub Max è presente una fotocamera che viene utilizzata per una funzione "Face Match" in grado di identificare un utente. se vuoi davvero leggere troppo nel nome in codice ispirato a Zoolander, "Blue Steel" parla di fare una faccia per la telecamera. Tuttavia, il Nest Hub più piccolo non ha una fotocamera frontale, quindi non sarebbe molto scalabile su tutta la linea Nest Hub / Home Hub. Senza contare che se Google volesse che questo tipo di interazione fosse lo standard, probabilmente vorrebbe che funzionasse anche su altoparlanti intelligenti.

Google dispone anche di una funzione di rilevamento della presenza più scalabile: Ultrasonic Sensing. Questo è il sonar: gli altoparlanti emettono suoni impercettibili e registrano qualsiasi rimbalzo da un oggetto che si è spostato davanti al dispositivo. Il rilevamento delle persone basato sul sonar probabilmente funzionerebbe su qualsiasi cosa con un microfono e altoparlanti, che sarebbe scalabile su tutto lo smart display e la linea di altoparlanti intelligenti.

Dobbiamo sottolineare che Google sta solo testando questa funzione per ora e le nostre informazioni provengono da una build interna trapelata che Google non ha mai voluto mostrare al pubblico. Non ci sono indicazioni che Blue Steel inizierà a essere distribuito a breve sui dispositivi consumer. Ottenere il giusto equilibrio su qualcosa di simile sarebbe assolutamente fondamentale e farebbe la differenza tra "veloce e utile" o "fastidioso e invasivo".

Immagine dell'elenco di Jan Boromeusz