Podcasts, replay d’émissions radio, livres audio ou articles lus font désormais partie du paysage audio, façonné par les technologies numériques. Un développement permis par la démocratisation des accessoires connectés, smartphones en tête, mais aussi enceintes à commande vocale ou technologies embarquées dans l’automobile. Un article également disponible en version audio.
Écoutez cet article :
Tous les voyants sont au vert pour l’audio. Les technologies numériques dopent l’usage du son, notamment en mobilité. Le bon vieux poste de radio n’est plus l’accessoire incontournable ; il est détrôné par nos smartphones et les enceintes à commande vocale. Trois quarts des internautes (76,3 %) écoutent un contenu audio digital chaque mois, selon l’étude Global Audio 2022 de Médiamétrie. Aujourd’hui, près de la moitié de la consommation audio se fait via internet (48 %), essentiellement sur le téléphone mobile. « On observe une oralisation rapide de la société », remarque Anne-Marie de Couvreur, présidente de Mediameeting, qui a lancé la première radio nationale en digital, Airzen, soulignant l’engouement pour les fonctions audio de Whatsapp ou les SMS audio. « L’oralisation permet d’accélérer les échanges, mais aussi le commerce », précise-t-elle.
De fait, la pub suit le mouvement avec une hausse de 53 % des recettes publicitaires en audio digital (après +58 % en 2021), selon le 29e Observatoire de l’e-pub. Webradios, streaming musical, podcasts et assistants vocaux représentent désormais 73 millions d’euros d’investissements publicitaires. Et le nombre d’annonceurs a quasiment doublé (+93 % de janvier à septembre 2022), selon Kantar.
- Le boom des podcasts
Le développement de l’audio numérique est porté par l’engouement du public pour les podcasts. Leur écoute a progressé de 17 % en 2022 (17,6 millions d’auditeurs, selon le Focus Podcasts de Global Audio). Depuis le confinement, l’écoute d’émissions radio en différé et de podcasts natifs s’est accélérée, incitant des acteurs qui ne viennent pas de l’audio, comme des groupes de presse, à développer ou à acquérir des activités dans la production sonore. « Le podcast, c’est le fer de lance du développement de l’audio digital », résume Nathalie Hasson, head of audio narrative chez HRCLS, société de production du groupe Havas.
La consommation de contenus audio à la demande permet de reconquérir le public jeune qui se détourne de la radio. La diffusion d’un flux audio des influenceurs (comme Les actus du jour par Hugo décrypte, podcast le plus écouté avec près de 1,4 million de téléchargements, selon l’ACPM) permet d’atteindre un public jeune à un moment où celui-ci ne peut consommer de la vidéo, souligne Sébastien Ruiz, head of GroupM Audio.
Les podcasts permettent aussi de toucher une audience encore plus jeune. « Nous avons offert aux jeunes parents un univers dans lequel leurs enfants peuvent se plonger en toute sécurité », détaille Erwann Gaucher, adjoint à la direction des antennes et de la stratégie éditoriale de Radio France, qui cite le succès des podcasts Les Aventures du petit Nicolas ou Oli. « Dans un monde perçu comme brutal, voire effrayant, les podcasts natifs véhiculent des valeurs rassurantes de douceur et de tolérance », analyse Julie Gaillot, directrice du pôle Society à l’institut CSA, qui a piloté l’étude « Les Français.e.s & le podcast natif » pour Havas Paris.
« L’audio souffre encore d’un vrai problème de découvrabilité de l’offre : la découverte des podcasts se fait encore majoritairement par le bouche-à-oreille », regrette Sébastien Ruiz. Spotify a annoncé son ambition de jouer ce rôle d’application de référence, mais avec le licenciement de 6 % de ses effectifs et le départ de Dawn Ostroff, chief content officer, considéré comme le « Monsieur podcasts » de la plateforme, le pari va-t-il pouvoir être remporté ?
Lire aussi : Le secteur du podcast en pleine consolidation
- Les enceintes au sein des foyers
Les enceintes connectées à commande vocale se font peu à peu une place dans les foyers français. Plus d’un quart des Français (27 %) en possède une, selon le Baromètre du numérique 2022 de l’Arcep, ils n’étaient que de 9 % en 2019. Cet accessoire séduit surtout les jeunes (autour de 40 % d’équipement en dessous de 40 ans). C’est désormais le deuxième device utilisé pour écouter de la radio en numérique.
« Les enceintes remplacent petit à petit le poste de radio traditionnel », avance Laurent Frisch, directeur du numérique et de la production à Radio France. Le groupe public teste l’accès à des podcasts via chemins conversationnels. « Pour l’instant, cela n’attire pas l’auditeur ; il faut se contenter de proposer du contenu simple à appeler, comme le flash info », indique Erwann Gaucher. « L’expérience utilisateur sur les enceintes est encore à améliorer », abonde Sébastien Ruiz de GroupM. Déjà, Radio France s’est associé au groupe Bayard pour développer Merlin, une enceinte non connectée avec du contenu audio pré-embarqué destiné aux enfants.
Parmi les usages privilégiés sur les enceintes connectées, l’écoute de livres audio. Le secteur est largement dominé par Audible, filiale d’Amazon, qui joue de ses synergies avec les équipes d’Alexa. Le catalogue du groupe américain compte plus de 700 000 titres, dont 19 000 en langue française. 13 % des Français écoutent des livres audio et des podcasts sur des enceintes connectées, d’après une étude Audible/Kantar de 2022. Un usage très prisé pour l’écoute en famille.
- Le text-to-speech
Autre levier de développement pour l’audio numérique, la synthèse vocale (ou text-to-speech). Celle-ci permet à des acteurs comme des éditeurs de presse (tel Stratégies) de développer leur offre d’articles en écoute audio. Dès le milieu des années 2010, Mediapart et Le Monde diplomatique ont commencé à proposer des articles à écouter, mais il s’agissait alors de textes lus. Les technologies de synthèse vocale permettent désormais de convertir du texte en audio de façon quasi instantanée et avec un confort d’écoute plus ou moins satisfaisant (lire l’interview de Nathalie Birocheau). Le Monde a franchi le pas en novembre dernier avec une version audio de La Matinale. Chaque matin, les abonnés ont accès à une sélection d’articles qu’ils peuvent désormais écouter. « Le text-to-speech constitue une évolution importante pour la presse, cela lui permet de conserver son audience en mobilité ou pendant qu’elle réalise d’autres tâches », estime Sébastien Ruiz.
Lire aussi : La radio en plein tournant digital
- L'audio embarqué
L’audio numérique embarqué dans les voitures est annoncé comme un futur levier de développement. Alors que les nouveaux véhicules doivent être équipés d’autoradios compatibles avec la technologie numérique hertzien (DAB+), les acteurs de l’audio tentent de garder un pied dans les futurs équipements embarqués, l’écoute de la radio en voiture étant l’un de ses usages les plus fréquents. C’est dans cette logique que Radioplayer France, l’alliance entre les principaux groupes de radio, a signé au printemps 2022 un partenariat avec Renault pour lancer son application dans les nouveaux modèles du constructeur et a noué des accords avec Volkswagen et BMW. De son côté, ETX Majelan a conclu un accord avec Continental afin de développer une plateforme audio embarquée. « L’industrie automobile est confrontée à un changement absolu de paradigme : du hardware au software, de la mono-modalité à la multi-modalité, analyse Jérôme Doncieux, CEO d’ETX Majelan. Historiquement, la valeur d’un véhicule reposait sur l’extérieur de l’habitacle, elle va basculer vers l’intérieur. » Mais « la voiture autonome constitue une menace pour l’audio : une fois que le conducteur ne sera plus obligé de regarder la route, il pourra consommer de la vidéo », avertit Sébastien Ruiz.
Nathalie Birocheau, CEO de l’Ircam Amplify : «La place du son est en train de changer»
Quelle place occupe l’audio dans notre société ?
La place du son est en train de changer, car les outils technologiques - canaux de distribution et appareils de réception - sont plus accessibles et offrent une qualité croissante. Le confinement a accéléré les usages de la voix à distance puisque nous ne pouvions plus utiliser certains de nos sens (toucher, sentir), seulement voir et entendre…
Pourquoi l’audio a-t-il connu un engouement aussi rapide ?
Le son est facile à produire et léger à diffuser, son coût est donc réduit par rapport à la vidéo. De plus, le son déclenche des récepteurs très puissants dans le cerveau et produit des effets émotionnels démultiplicateurs : il génère des émotions bien plus fortes que le visuel, car il fait appel à l’imagination.
La synthèse vocale va-t-elle remplacer la voix ?
La technologie text-to-speech est désormais mature ; elle est utilisée pour des conversions à la volée de contenus écrits en audio. Toutefois, celle-ci ne reproduit pas la prosodie, c’est-à-dire la musicalité de la voix, qui restitue les émotions et les intentions. Cette absence d’émotion dans les voix de synthèse conduit au phénomène de « text-to-speech fatigue ».
Avec l’IA, n’y a-t-il pas un risque de fake voice ?
S’il est très compliqué de copier une voix en restituant l’émotion, les intelligences artificielles sont en train d’apprendre à reproduire la voix, ce qui pose de vraies questions éthiques. À terme, il faut qu’il y ait des outils qui permettent d’identifier ces faux contenus audio. L’Ircam travaille sur un projet de recherche sur le sujet. Mais il faut aussi que nous développions notre sens critique.