Dossier Vocal
Le développement des assistants vocaux comme Google Home et Amazon Echo pourrait donner un sérieux coup d'accélérateur au vocal, déjà entré dans le quotidien d'un certain nombre de consommateurs. Marques et médias sont dans les starting-block à l'aube de cette révolution conversationnelle.

[Cet article fait partie du dossier publié le 24/05/2018 dans le Stratégies n°1951] 

Avec l’explosion des podcasts, le développement de l’ASMR, ces murmures qui titillent les oreilles, et le boom des enceintes connectées, on n’a jamais autant parlé de la voix. À eux seuls, les assistants vocaux Google Home, Amazon Echo, Apple HomePod ou Cortana de Microsoft suscitent les convoitises, avec des chiffres d’adoption faramineux. 4% des foyers américains sont déjà équipés en Amazon Echo, rappelle l’étude Speak Easy de JWT Intelligence. Google annonçait, début 2018, 10 millions d’appareils Home écoulés tandis que Microsoft revendique 148 millions d’utilisateurs actifs pour Cortana, disponible sur Windows, Android et iOS. La recherche vocale n’est pas en elle-même une nouveauté : apparu en 2011, Siri, l'assistant vocal de l’iPhone, répond à 2 milliards de questions par semaine. Et selon le GlobalWebIndex, 25 % des 16-25 ans utilisent déjà un assistant vocal pour effectuer des recherches sur mobile. Mais l’arrivée des enceintes connectées dans les domiciles accélère aujourd'hui l’adoption de ce mode d’interaction. «Par leur fluidité d’utilisation, ces supports boostent la consommation audio, se félicite Jean-Pierre Cassaing, directeur du département audio chez Havas Media. Les utilisateurs peuvent interagir avec eux alors qu’ils sont en train de faire autre chose, ils leur permettent d’être multitâches et de gagner du temps.»

En voiture Siri 

Outre la maison, ce type de terminaux trouve aussi sa place dans le secteur automobile, où l’on attend 2,8 milliards de dollars de revenus générés par les applications vocales d’ici 2024, selon Global Market Insights. Les Gafa travaillent sur des scénarios d’usage incluant les déplacements, pour assurer une continuité d’expérience entre les sphères personnelles et professionnelles. «Par rapport au téléphone, qui est dédié à la voix et au texte, un objet uniquement centré sur la voix développe de facto cette utilisation, argue Florent Depoisier, codirecteur général de JWT Paris. Quand on voit la vitesse d’acceptation des appareils aux États-Unis et la facilité avec laquelle les jeunes générations se les approprient de façon intuitive, on n’est pas dans un phénomène de mode, d’autant que la marge d’erreur des algorithmes de reconnaissance vocale est désormais très faible. Le vocal, c’est comme le digital : soit on monte dans le train, soit on reste sur le quai.»

La technologie de Google dans la reconnaissance vocale se rapproche désormais des 100% d’exactitude, note une étude du Capgemini Digital Transformation Institute, publiée début 2018. Intitulé «,Commerce conversationnel: pourquoi les consommateurs adoptent-ils les assistants vocaux? », ce rapport se base sur une enquête menée auprès de 5000 personnes aux États-Unis, Royaume-Uni, France et Allemagne. Si 24 % des consommateurs disent privilégier un assistant vocal à un site web dans leurs recherches, cette proportion pourrait grimper à 40% dans trois ans, affirme-t-il. Autre enseignement, 51% des répondants déclarent déjà utiliser un assistant vocal, principalement sur leur smartphone (81%). En tête des usages, la recherche d’informations (à 82%), puis la musique (67%) et les contacts avec un service client (36%). Viennent ensuite les achats de produits (35%), les services (35% la livraison de repas, 28% les virements bancaires, 28% la commande de taxi) et la domotique (31%). Du côté des intentionnistes, 56 % se disent prêts à utiliser un agent vocal pour commander dans un restaurant, 44% pour effectuer une opération bancaire. Selon Thomas Saint Hilaire, directeur associé innovation de Prosodie-Capgemini, «les secteurs de la banque et de l’assurance sont les plus avancés» dans les développements vocaux, suivis du retail.

Antiparasites

Parmi les éléments qui pourraient encourager encore les usages, les répondants citent massivement la compréhension de l’accent et de la diction (81%), la pertinence des recommandations (75%) et la clarté de la conversation (75%). Autant de subtilités que Capgemini résume par «la compréhension du contexte» et que Microsoft confirme dans ses recherches. «Dans une logique de machine learning, on apprend en permanence à Cortana à s’améliorer dans la compréhension des accents en éliminant les bruits environnants et les tics de langage, tous ces “heu” et “voilà” qui parasitent les phrases, afin d'identifier les intentions de l’utilisateur. C’est la difficulté principale, mais plus on recueille de données, plus on est pertinent», explique Bernard Ourghanlian, directeur technique et sécurité de Microsoft France.

La question des données est au cœur du futur de la technologie. Lorsqu’on interroge les non-utilisateurs sur leurs freins à recourir à un assistant vocal, ceux-ci mentionnent en priorité la sécurité de leurs données personnelles. Outre la crainte des piratages, il est tentant de voir dans les enceintes connectées des mouchards qui espionneraient les conversations privées. Si la technologie est en passe d’arriver à maturité, la bataille de la confiance doit encore être gagnée.

Lire aussi :

Assistants vocaux : vers une deuxième vague ?

Podcast : la ruée vers l’or

Chiffres clés

4%. Foyers américains équipés en Amazon Echo.

10 millions. Appareils Google Home écoulés début 2018.

2 milliards. Questions traitées chaque semaine par Siri.

Suivez dans Mon Stratégies les thématiques associées.

Vous pouvez sélectionner un tag en cliquant sur le drapeau.