Données
Nouveau concept en vogue, la « data noire » pourrait bien devenir le buzzword du secteur en 2018. Mais qu'est ce qui se cache derrière ce concept ?

C’est le nouveau concept à la mode, qui pourrait devenir le buzzword de 2018, dans le monde de la donnée : la « dark data » ou « dark analytics ». Formalisée par Deloitte, dans son rapport sur les tendances à venir dans le secteur, le principe est en vogue depuis quelques mois. Tellement dans l’air du temps qu’Apple a déboursé 200 millions de dollars, le 15 mai dernier, pour s’offrir Lattice Data, une société spécialisée en machine learning, et qui a fait des « dark data » son mantra. Quel concept se cache derrière ce terme que l'on pourrait imaginer tout droit sorti d’un film de science-fiction ? Traduit en « données noires » ou « données sombres », le terme ne désigne en aucun cas des données sulfureuses. Il faut comprendre l’expression à l’aune de la « matière noire » dans l’espace. Cette masse inconnue, invisible, dont on a prouvé l’existence, mais dont on ne sait strictement rien, sinon qu’elle a une masse, et qu’elle compose une grande partie du système solaire. Il en est de même de la « donnée noire ». Elle existe, en grande quantité, mais on ne sait pas encore trop où. Dans tous les cas, elle n’est pas visible au premier abord. « C’est l’ensemble des données cachées dans le système informatique », explique Réda Gomery, directeur associé Data, business intelligence et analytics pour le cabinet Deloitte. Et si « caché » est un bien grand mot, on peut dire qu’elles ne sont pas encore formalisées, ou tout simplement pas encore utilisées. « On estime souvent qu’on n’utilise dans une entreprise que 20% des data disponibles », continue Reda Gomery. Même s’il s’agit d’une évaluation non réellement scientifique, sûrement inspirée de la règle symbolique des 80/20… Quoi qu’il en soit, le fait qu’un très grand nombre de données ne soient pas exploitées est une réalité. Ces dernières années, les acteurs de la data ont surtout privilégié les partenariats extérieurs. Aujourd'hui, les annonceurs prennent conscience qu’ils ont encore de l’or au bout des câbles. « La tendance est une réalité. Même si elle ne fait que mettre un mot sur quelque chose qui existe depuis longtemps »explique Maurice Ndiaye, cofondateur de l’agence spécialisée data, Synomia. « Les annonceurs se disent : « Tiens, j’ai encore des données chez moi ! » Des mails, des verbatim, des extraits de conversation chat… Plein de choses qu’ils collectaient sans le savoir. Et comme la méthode devient de plus en plus centrée sur le consommateur, il y a un regain d’intérêt sur ces données internes. »

 

« Gare aux données personnelles »



Cependant, jeter un œil sous le capot de la voiture que l’on découvre dans son propre garage demande des précautions. « Ces data cachées sont de natures très différentes. Et il vaut mieux faire attention car il peut y avoir des données très personnelles ! » insiste Maurice Ndiaye. Parmi les « dark analytics » les plus courantes, on trouve surtout les données non structurées. C’est-à-dire celles qui ne constituent pas une donnée directement interprétable, tirée d’une mesure directe, mais qui a besoin d’être placée dans un contexte, comparée à d’autres données, comme des mots. « Quand on explore la base de client, elles sont très abondantes », pointe Réda Gomery. Les plus fréquentes sont les mails, les notes, les messages (réseaux sociaux, commentaires…), des notes internes, des documents… Ce sont bien souvent des formats textuels qui n’ont jamais été traités ni analysés. Soit parce que la technologie d’analyse sémantique précise n’existait pas encore, parce que les compiler et les rassembler dans un format exploitable est très complexe, ou encore parce que ce n’était pas la priorité au moment où elles ont été créées. « Dans les questionnaires de satisfaction, par exemple, on se concentre sur le score final, car c’est ce qui intéresse la hiérarchie, mais pas le verbatim. Alors qu’il peut en dire long sur le client ou le service ! », détaille Maurice Ndiaye.

 

« Cartographier son réseau de data »

 

D’autres formes de données structurées se font de plus en plus nombreuses : les images, ou les fichiers audio et vidéos. En moins de dix ans, le coût des capacités de stockage a diminué de 15 à 20%. Résultat : même les plus petites organisations ont la capacité de stocker des fichiers bien plus volumineux. Des parcours clients au sein d’un rayon, des expressions faciales, des discussions téléphoniques issues du service après-vente… Analyser ces fichiers peut se révéler extrêmement efficace. Parmi les autres données cachées, on trouve aussi des données structurées, c’est-à-dire déjà formalisées et mesurées précisément, mais pas forcément liées à d’autres données. « Pour une entreprise, cela peut consister à faire le lien entre l’emplacement sur le parking et le bien-être des salariés », pointe le rapport de Deloitte. Et ainsi peut-être prendre les mesures les plus adaptées. « Pour cela, il faut bien cartographier son réseau de données en amont, et surtout s’attacher à briser les silos », conseille Réda Gomery. Des poncifs, donc, toujours bon à rappeler. Car si la « dark analytics » traduit bien une préoccupation concrète des annonceurs, elle reste une mode qui se base sur les mêmes fondamentaux. Mais elle a le mérite de remotiver les troupes – et tout le marché – derrière un nouveau concept. 

Fouillez le SAV !

« Nous avions pour mission de réaliser un programme de fidélité pour un distributeur spécialisé  » raconte Réda Gomery, directeur associé Data, Business Intelligence et Analytics pour le cabinet Deloitte. « L’adage veut que des études soient réalisées pour établir ce programme. Mais nous nous sommes aperçus que les données clients du SAV contenaient énormément d’éléments, et n’avaient jamais été utilisées. Elles nous ont permis de gagner beaucoup de temps pour déterminer la stratégie. » Et donc de lancer le programme plus efficacement. De même, toutes les notes écrites et non formalisées constituent un monceau de données très utiles. Que ce soit en magasin, ou dans un hôpital - les notes du médecin sur les patients. Elles sont hors processus, mais contiennent souvent une mine d’informations… 

Suivez dans Mon Stratégies les thématiques associées.

Vous pouvez sélectionner un tag en cliquant sur le drapeau.