Ce mantra est bien connu et s’applique à de nombreux domaines dont le marketing ou le jeu de Go. Il peut aussi s’appliquer à la Data. La volonté d’utiliser la data est commune à toutes les entreprises de tous les secteurs. Mais, les projets accomplis connaissent des succès variables. L’année 2019 a été une année de rationalisation et de consolidation. En 2020, les entreprises attendent de récolter les fruits de leurs investissements. Il va falloir passer des grands plans à des actions concrètes et efficientes.
Un besoin de structuration centrale
L’ère des POC sans lendemain semble donc derrière nous. Chaque projet viable doit ainsi rapidement passer du stade de prototype à une mise en production à l’échelle. La gouvernance fixe les règles qui permettent de rendre cela possible. Il convient d’abord d’impliquer dès la conception du cas d’usage, les métiers, les responsables techniques, les Data Scientistes et les responsables de la Data. Il est ensuite nécessaire d’assurer une évaluation continue des enjeux techniques, organisationnels et réglementaires. Un lancement de projet est alors décidé dans le respect de l’ensemble de ces règles.
La Data Gouvernance peut être définie comme la mise en place de ces règles. Elle aborde les sujets d’organisation entre Data Owner et Data User. Elle régit les collaborations, croisements et enrichissements de données. Elle fixe les métriques d’éligibilité et de priorisation des différents projets. Elle adresse en cela l’ensemble des objectifs des interlocuteurs concernés. Et, elle assure le respect des réglementations.
Cette réflexion aboutit généralement à une approche centralisée. Ce qui se traduit par l’élaboration des assets techniques, Data Lake ou autre Data Warehouse, en premier puis ceux-ci sont mis à disposition pour les usages des métiers. J’ai été au cœur de cette approche chez un des leaders des services en France. En quelques années, ce groupe a mis en place un Centre de Service Data très performant, avec des règles d’échanges de données et de déploiements de services internes très claires et précises. Mais, les différents métiers / entités ont des objectifs très disparates et le Centre de service a été perçu comme un prestataire interne leur imposant des règles et des coûts non adaptés à leur besoin.
Un besoin d’adaptation locale
La structuration globale de ce service induit une disproportion des moyens par rapport à certaines attentes. Et cela s’explique par une trop forte standardisation des réponses apportées à des objectifs très divers.
Chaque application de la Data a des objectifs propres déterminés en accord avec les métiers concernés. Le ROI de cet usage va dépendre des arbitrages qui seront faits (qualité vs coût / performance et risques vs agilité). Tenter d’imposer les mêmes objectifs à tous peut être trop coûteux ou trop risqué. Il revient donc à la Data Gouvernance de définir les règles et les outils de Data Management et de Data Quality adaptés à chaque usage en fonction de ses objectifs propres.
Un autre exemple marquant est illustré dans un groupe d’assurance. Celui-ci a déployé son DataLake avec succès et intègre des centaines de sources de données. Le premier usage a consisté à mettre à disposition des Data Scientistes un bac à sable pour chercher et tester de nouvelles idées de produits (évaluation des risques, détection des fraudes, …). Le second usage vise à alimenter le Dashboard financier du COMEX. Clairement, les risques et les attendus sont différents pour ces deux usages. D’une part, les données fournies au COMEX doivent impérativement être garanties à 100%. D’autre part, les Data Scientistes ont besoin de vélocité et d’agilité pour proposer de nouvelles idées à moindre coût.
Une conciliation possible
Les usages de la Data sont étonnamment riches et variés. Le potentiel de gain doit être recherché par tous les métiers au sein de l’entreprise. Pour libérer les initiatives, les collaborateurs doivent être accompagnés dans l’utilisation des données au service de leur problématique. Une maîtrise globale sécurise l’entreprise et les collaborateurs et passe par une stratégie de Data Gouvernance, fondée sur des indicateurs facilitant la prise de décisions et le suivi de ces décisions. Il y a ainsi un équilibre à trouver, qui passe nécessairement par les bonnes règles et les bons outils de Data Management / Data Qualité.
La bonne articulation entre le cadre global et les usages locaux conduit à l’excellence Data opérationnelle.