Une voix rauque, féminine, sensuelle même, celle de l’actrice américaine Scarlett Johansson, qui vous parle au creux de l’oreille. Tout au long de la journée, elle vous guide, vous écoute, vous conseille, entre assistante personnelle, meilleure amie et même psychologue. Bienvenue dans le film Her, de Spike Jonze, qui dès 2014 dresse le portrait d’une société dans laquelle chaque individu est doté d’un assistant virtuel : celui-ci l’aide au quotidien et apprend en permanence afin d’être toujours plus pertinent dans ses réponses. Et si les enceintes à commande vocale Google Home et Amazon Echo, arrivées cette année sur le marché, restent encore très loin de l’assistant virtuel incarné par Scarlett Johansson dans Her, les progrès en matière de machine learning et d’intelligence artificielle promettent de s’en approcher dans les années qui viennent.
« La voix est une interface qui va prendre une place prépondérante ces prochaines années. Les objets connectés deviennent de plus en plus petits, ce qui nécessite de passer par la voix et non plus par un écran ou un clavier pour interagir avec », explique François Loviton, directeur retail et e-commerce chez Google France. « Les enceintes à commande vocale vont un cran plus loin dans l’interaction entre l’homme et la machine : on se rapproche d’une interaction qui n’est plus différente de celle qu’on a avec les autres êtres humains », ajoute Sébastien Genty, directeur général et directeur du planning stratégique chez DDB.
Multitude d'enceintes.
Déjà, 20 % des recherches sur Google aux États-Unis passent par la voix, pour l’essentiel depuis l’assistant vocal proposé sur smartphone, que l’utilisateur sollicite en commençant sa requête par « OK Google ». « Aujourd’hui, ce ne sont pas tant les acteurs du search qui tirent la croissance du vocal que l’usage des 15-25 ans sur les messageries instantanées, comme Whatsapp et Snapchat », estime Julien Féré, directeur des stratégies de KR Media. L’arrivée sur le marché d’une multitude d’enceintes à commande vocale à des prix abordables (59 euros pour le Google Home Mini par exemple) pourrait accélérer cet usage et même le massifier auprès d’une cible bien plus large.
Face à l’appétence croissante des Occidentaux pour le format audio - comme en témoigne le succès des podcasts et des livres audio -, les médias entendent bien profiter de ces nouveaux supports pour diffuser plus largement encore leurs contenus. C’est dans cette logique qu’aux côtés des acteurs historiques de la radio se multiplient les pure-players de l’audio, comme Binge Audio, Nouvelles écoutes ou BoxSons en France, qui voient dans Google Home et consorts l’opportunité de prendre une longueur d’avance sur les médias traditionnels.
Les titres de presse écrite sont aussi nombreux à se lancer dans la bataille de l’audio, à l’image du groupe Prisma Media, ou à l’étranger du New York Times ou du Financial Times, qui propose désormais ses articles en version audio. « De plus en plus de personnes souhaitent se détacher des écrans et faire travailler leur imagination à travers l’audio. Orson Welles ne disait-il pas qu’"à la radio, l'écran est plus grand qu'au cinéma" ? », rappelle Sébastien Genty. « Le vocal implique une nouvelle façon d’enchaîner les contenus, ce qui nous impose de travailler la sémantique et les mots clés différemment pour que les gens puissent passer d’un programme à l’autre », insiste Joël Ronez, cofondateur de Binge Audio.
Incarnation.
Pour les marques, le boom annoncé du vocal promet aussi des changements de taille. « Parmi les premières questions qui vont se poser, celle de la prononciation des marques. Souvent, l’usage des consommateurs et la façon dont les marques parlent diffèrent, d’où un travail à faire sur l’éducation du consommateur ou sur les concessions à faire côté marque pour accepter de ne pas être bien prononcé », avance Julien Féré. Autre enjeu, la nécessité pour les marques de se créer, plus qu’une identité sonore, une personnalité. « Quand l’utilisateur parle à un objet, il projette l’image d’un être humain. La marque devra donc réfléchir à son incarnation, aux attributs qu’elle souhaite porter, que ce soit à travers son timbre de voix, le ton avec lequel elle parle, son style de réponse… », analyse François Loviton.
C’est dans cette logique que Google a travaillé avec des dialoguistes du studio Pixar. Objectif : donner à son assistant vocal une voix et une personnalité suffisamment fortes pour que les utilisateurs créent un lien affectif avec lui. En jeu, le pouvoir de recommandation de ces assistants personnels, dont les réponses se limiteront à quelques-unes - loin de la vingtaine de pages de résultats sur Google. « La voix réduit le choix », insiste Eric Scherer, directeur de la prospective à France Télévisions.
Quid de l’impact de ces nouveaux compagnons sur nos autres relations ? « Nous risquons d’attendre de notre relation aux autres cette même précision, concision et rapidité. Face à la relation fluide et désirable qu’on aura avec notre assistant personnel, il n’est pas sûr que nous supportions encore une contradiction, une attente ou une relation irascible », prévient Sébastien Genty. OK Google ?