MARKETING COMMUNICATION MEDIAS DIGITAL
Votre Flux Rss Stratégies Idées / Tribunes
Retour à la page précédente
Augmenter la taille du texteDiminuer la taille du texteVersion imprimable de l'article
Page 1/2

Big data: vers une logique data centric

Data

16/02/2016

David Fala, directeur practices big data et data intelligence de Micropole
David Fala, directeur practices big data et data intelligence de Micropole

David Fala, directeur practices big data et data intelligence de Micropole

S’il est acquis que la création de valeur passe par l’exploitation de la data, il est important pour l’entreprise, à l’ère du big data, de se poser les bonnes questions quant à sa capacité à identifier, capter, analyser la donnée, mais surtout quant à sa capacité à en percevoir sa valeur pour elle-même, ses clients, ses fournisseurs ou ses partenaires.
En adoptant une vision data centric, l’entreprise se met en capacité de tirer de la valeur de toutes les données, qu’elles soient blanches (internes), grises (externes) ou noires (dark data: données présentes en masse au sein des entreprises mais non exploitées). Or, pour y arriver, l’entreprise doit modifier son approche actuelle de la donnée, héritée de vingt ans de culture de la business intelligence.

Vision issue de la business intelligence 

Les architectures d’analyse de la donnée présentes au sein des entreprises sont le plus souvent construites suivant un même modèle. Des outils de collecte des données les déversent dans un espace de stockage où elles seront nettoyées et mises en conformité, pour finalement être stockées dans un «data warehouse», afin qu’elles puissent être analysées par des utilisateurs grâce à des solutions de business intelligence.
Les frontières de la donnée et de l’analytique sont donc cantonnées à un périmètre contenu et maîtrisé par l’entreprise. L’ensemble du processus ayant pour objectif de répondre à des questions posées sur des données connues. Si l’entreprise sait anticiper la valeur liée à l’exploitation des données blanches, qu’en est-il de l’exploitation des données grises et dark data puisque, par définition, elle n’est pas préparée pour accueillir ces données, et encore moins pour en déterminer leur valeur?

Premier étage de la fusée data centric: repenser l’approche de la donnée
Pour que l’entreprise se mette en capacité de tirer de la valeur de toutes les données, c’est-à-dire tout collecter, tout stocker et tout analyser, elle doit modifier son approche de la donnée. La logique actuelle consiste alors à mettre en œuvre une plateforme big data afin d’y déployer un «data lake». Ce lac de données apporte une nouvelle agilité au système d’information, en fournissant un espace de stockage et d’analyse global de toutes les données, qu’elles soient brutes ou raffinées, issues des sources internes ou en provenance de sources externes.
L’erreur souvent constatée est que l’entreprise conserve sa vision classique de l’intégration des datas: la donnée est alors extraite d’une source et recopiée au sein du data lake afin de la rendre disponible pour l’analyse. Or, avec l’avènement des très gros volumes de données, cette stratégie consistant à ramener l’ensemble de celles-ci dans un point unique peut s’avérer contre-productive. Potentiellement coûteuse en temps, traitement et stockage, la valeur générée peut s’avérer faible. Il est donc important de cadrer les sources de données à intégrer et de repenser sa stratégie d’intégration inter-applicative.
Pour réussir sa stratégie data centric, il faut l’associer à une autre notion: l’entreprise étendue.

L’entreprise étendue: redéfinir les frontières du système d'information

Aujourd’hui, les directions informatiques ont «abandonné» certaines données, étant dans l’impossibilité de les capter et/ou de les intégrer facilement au système d’information (SI). Ces données grises et dark data sont,  par exemple, les données digitales générées dans le cloud et manipulées directement par les directions marketing, ou encore certaines données de production industrielle restant sur site car compliquées à rapatrier au sein du SI. La notion de silos de données est alors ici poussée à son paroxysme; le silo n’est plus dans le data warehouse, mais déporté «quelque part» à l’intérieur ou à l’extérieur de l’entreprise, tout en restant visible par le métier.
La notion d’entreprise étendue est née de la constatation que les DSI (directions des systèmes d'information) ne considèrent ou ne valorisent une donnée que si elles savent l’identifier, la gérer et au besoin la stocker. Dans la logique data centric, il doit être possible de voir et d’analyser toutes les données de l’entreprise, y compris celles qui ne sont pas à l’intérieur des frontières classiques du système d’information. Or, comme recopier toutes les données en provenance de toutes les sources n’a pas de sens, même dans un contexte big data, il est nécessaire de privilégier une approche dans laquelle le SI sera virtuellement étendu à l’ensemble des sources de l’entreprise. Mais si toutes les données ne sont pas recopiées localement au sein du data lake, alors comment les croiser et les analyser pour en tirer de la valeur?


Page 1/2
Google+
Facebook
Vos commentaires

Réagissez à cet article
Merci de vous identifier afin de pouvoir publier un commentaire : Identifiez-vous

Pas encore d'identifiant ? Créez vos identifiants