Linguistique
La start-up française Data 2 Content se présente comme une agence de robots-rédacteurs. Sa cible : les médias et les sites d'e-commerce. Le Monde est le premier site d'information à avoir utilisé cette technologie à l'occasion des départementales.

Que faire de toutes ces données disponibles sur internet, qu’il s’agisse d’open data, de caractéristiques techniques ou d’informations chiffrées sur les cours boursiers, la météo ou les résultats d’élection? Pourquoi ne pas en faire des textes qui puissent être référencés par Google et qui soient plus faciles à lire pour un internaute qu’un simple tableau? C’est ainsi qu’est née la société Data 2 Content, «spin-off» de la start-up spécialisée dans la sémantique pour le web Syllabs et qui prévoit de lever des fonds d’ici à la fin de l’année.

«Lorsque nous avons commencé à développer cette technologie en 2011, le sujet de la rédaction automatique était tabou. Depuis quelques mois, nous assistons à un vrai revirement des mentalités, notamment parce que les médias consacrent beaucoup d’articles au robot-journalisme, même si nous préférons parler de robot-rédacteurs», explique Claude de Loupy, président et cofondateur de Syllabs.

Aide au contenu

Data 2 Content, qui a été sélectionnée fin 2014 dans le Top 100 EBG Start-up, emploie aujourd’hui 11 personnes, dont trois linguistes, et compte à son actif une vingtaine de clients, dont la plupart préfèrent rester anonyme. Parmi eux, des sites d'e-tourisme et d'e-commerce, dans des secteurs aussi éclectiques que les chaussures, la lingerie et même les pneus.

Les médias commencent aussi à regarder de près ce type de solutions. Aux Etats-Unis, l’agence Associated Press a sauté le pas pour la publication d’articles financiers. En France, Data 2 Content a déjà signé avec Le Monde, qui a utilisé cette technologie pour les départementales, et discute de façon avancée avec cinq autres. «Les éditeurs ont conscience qu’il faut produire davantage de contenus qui ne nécessitent pas forcément un journaliste. Ce sont des articles qui ne verraient pas le jour autrement», souligne Helena Blancafort, directrice des opérations et cofondatrice de Syllabs.

Pour l'heure, la start-up commence par voir avec ses clients de quelles données ils disposent (fiches techniques, catalogue produits…). Si celles-ci ne sont pas assez complètes, elle peut les aider à constituer la base de données indispensable à la génération automatique de textes. Des linguistes élaborent ensuite un programme informatique, qui tient compte de la charte éditoriale et du ton que le client veut donner à ses contenus.

«Dès le départ, insiste Claude de Loupy, notre outil a été pensé pour avoir des textes d’une grande variabilité. C’est important car un texte original est mieux référencé par Google qu’un texte à trous et la rétention des utilisateurs est meilleure.»

Suivez dans Mon Stratégies les thématiques associées.

Vous pouvez sélectionner un tag en cliquant sur le drapeau.