Par Julien Traverse et Wade Wilson pour le groupe Facebook Google Home France,
Déclencher notre enceinte connectée par le “OK Google” ou le “Hey Google” a fait l’objet d’un débat constant depuis la naissance de notre assistant préféré. Pas naturel, ni esthétique selon certains, imprononçable selon les autres, sans compter la chimère partagée par de nombreux utilisateurs sur la possibilité de le personnaliser… Google a (presque) tenté d’améliorer plusieurs fois ce paramètre, avec la conversation continue (toujours disponible qu’en anglais), les ordres multiples (qui nous économisent du OK Google à tout bout de champ) et la possibilité de modifier la sensibilité (disponible en France grâce à une astuce). Mais aujourd’hui nous apprenons que Google teste le déclenchement de son assistant, sans même prononcer un mot !
Une fuite détectée par un “super utilisateur”
Jan Boromeusz est un habitué des avant-premières ! C’est déjà lui qui avait reçu en exclusivité mondiale la nouvelle interface sur les Nest Hub et Nest Hub Max. Selon Android Police, il bénéficierait, d’une manière ou d’une autre, d’une version super utilisateur réservée aux employés Google.
Dans une vidéo publiée sur Youtube, on aperçoit que le Nest Hub Max de Jan se déclenche par sa simple présence physique à proximité ! Grâce à la caméra ou aux ultrasons ? Difficile à dire. Mais le fait est là. L’assistant se déclenche sans qu’aucun parole ne soit prononcée.
Aussi incroyable que cela puisse paraître, un membre de l’équipe Google Home France à réussi à reproduire chez lui cette expérience. De manière beaucoup moins fluide et moins régulière que sur la vidéo ci-dessus, il ne fait pourtant aucun doute que l’assistant se déclenche par sa simple présence. Garantie sans trucage.
Plus de “OK Google”, un problème de confidentialité ?
Que l’on soit fan ou pas, le déclenchement de l’écoute par le OK Google ou le Hey Google, semble être un pare-feu important pour le respect de la vie privée et de la confidentialité. Des déclenchements intempestifs sont pourtant déjà monnaie courante, provoquant ainsi des enregistrements de bribes de conversations qui n’auraient pas dû avoir lieu. Ceci, à cause notamment de certains mots à consonance proche, ou encore pire, à cause d’une publicité télévisée reprenant mot pour mot le déclencheur. Mais cela reste encore anecdotique par rapport à cette éventualité. Que penser d’un déclenchement par simple présence ? C’est une certitude que tout sera bien plus pratique avec cette fonctionnalité. Mais à quel prix ?
On peut tout de même envisager que Google renforce encore la protection de notre vie privée, quitte à désactiver automatiquement les enregistrements dans le cas bien précis d’un déclenchement par simple présence. Google à déjà fait beaucoup d’effort dans ce sens, (notamment en désactivant par défaut tous les enregistrements). Et de toute manière, rien n’indique que cette fonctionnalité soit un jour rendue publique. Dans le pire des cas, elle ne sera très probablement que optionnelle.
Si on pouvait déjà choisir son mot clé cela serait une avancé. Impossible de croire que le système pourra détecter qu’on lui parle sans un début particulier… Mais vous pouvez toujours faire buzz avec ça.
Bonjour Julien,
C’est la présence de la personne, captée soit par la camera soit par les ultra-sons, qui déclenche l’écoute. Donc oui c’est possible, nous l’avons testé. Google n’ayant pas communiqué, c’est difficile d’en savoir, ni de savoir si cette fonction va être publique un jour.
Perso je vote pour » Jarvis » au lieu d’ok google
Et moi qui l’utilise en réveil matin. Je n’ose pas imaginer s’il se déclenche dès que je bouge la nuit, ou quand je regarde la TV au lit…
Il faut attendre encore quelques années avant que tout ceci soit réellement optimal. En effet, il faudrait que le device comprenne son environnement en utilisant ce qu’il voit et entend et en déduise que ce qui vient d’être dit par quelqu’un est pour lui de manière similaire à ce qu’un humain fait de manière transparente. Je suis certain que les labs des GAFA travaillent intensivement là dessus.
Bonsoir Julien Traverse, vous ne répondez pas vraiment à Julien. Il disait qu’il suffirait de choisir soi-même un mot clé (personnalisé) ou une suite de mots-clé pour que le déclenchement ait lieu d’une autre manière. Ce serait évidemment très simple à programmer de la part des développeurs. La vraie question c’est pourquoi refuser une telle facilité à l’utilisateur, pourquoi imposer le « Ok G. » ou le « Hey G. »…. sans autre possibilité. La réponse est évidente, mais politiquement (ou économiquement) incorrecte, voilà pourquoi certains dévient la question par une autre.
Bonjour Pinaquer,
Ce serait peut être effectivement facile à programmer. Par contre à appliquer je pense que ce serait beaucoup plus difficile. Quid des gens qui prendrait des noms trop difficile à prononcer ou au contraire trop commun, et qui ensuite viendrait se plaindre du manque ou de la trop grande réactivité de leur enceinte ? Pour moi c’est aujourd’hui, dans l’état actuel de la technologie, trop difficile.
Bonsoir Julien,
Je crois qu’il n’est pas nécessaire d’aller si loin dans la perspective.
Au lieu de « Ok, G » ou « Hey G. », l’utilisateur pourrait simplement dire « Ok » ou « Ok, Ok » ou »Hey ». Ou « Wake up (friend) ».
Ou encore une suite de mots ou de lettres spécifiques déjà très aisément reconnus, mais qui n’auraient pas de sens si prononcés dans une conversation, ou qu’on ne dirait jamais dans une conversation. Par exemple « fox table » ou « A, B, C ».
Inutile de prévoir des noms faciles ou difficiles.
Vous pensez vraiment que cette solution serait compliquée à mettre en application?
Ou bien s’agit -il plutôt de faire la publicité de cette société en permanence (aux personnes qui habitent sous le même toit) ou de ne pas risquer d’oublier son nom?