Dans notre premier article, nous expliquions ce qu’est une Modern Data Stack, un ensemble d’outils et de technologies permettant de collecter, traiter et mettre à disposition les données dans une organisation. Cependant, nous n’avons pas abordé la question cruciale : comment assurer le bon déploiement de ces outils en entreprise ?
Une idée reçue est de croire que la mise en place d’une Modern Data Stack est une simple question technique. Une entreprise qui décide de faire évoluer son infrastructure data ou d’en créer une ne peut pas se limiter à un choix technologique. Bien que ce choix soit important, il ne doit intervenir qu’après une réflexion approfondie sur les besoins et les objectifs.
Dans cet article, nous partageons une méthode structurée que nous utilisons chez nos clients pour déployer une Modern Data Stack avec succès.
1. Etat des lieux
Vision claire de l’existant afin d’élaborer une feuille de route adaptée au contexte de l’entreprise. Le véritable défi réside dans la construction du chemin pour y parvenir et non dans la cible à définir.
L’analyse de l’existant se fait autours de cinq grand piliers :
-
Organisation : Compétences disponibles, rôles et responsabilités en place
-
Gouvernance : Processus en place pour gestion des données (stockage, traitement, mise à disposition, ..)
-
Stack technique : Outils et technologies actuellement utilisés
-
Cartographie des données : Schémas simple de la circulation des données au sein de l’organisation
-
Maturité data : Mesurer la capacité de l’entreprise à exploiter ses données et d’identifier les lacunes dans ses processus de gestion des données, que ce soit en matière de collecte, d’analyse, de partage ou de sécurité.
Sans un état des lieux précis, les problèmes existants risquent simplement d’être migrés dans la nouvelle infrastructure. Parmi les pain points classiques, on retrouve les doublons, manque de référentiels de données, des problèmes de qualité des données, ou encore des difficultés d’accessibilité.
2. Définition de la stratégie
La stratégie doit garantir une vision claire et partagée, alignant toutes les parties prenantes sur des objectifs communs. Sa mise en œuvre repose sur plusieurs leviers essentiels : vision, ambitions et OKR, l’équipe projet , identification des risques et macro chiffrage et la feuille de route
2.1 Vision, Ambitions et OKR
Définit la direction à long terme de l’organisation, en alignant ses actions et décisions vers un objectif commun.
La vision stratégique définit le « pourquoi » d’un projet et en constitue la ligne directrice. Par exemple, la vision de LinkedIn est : « Créer des opportunités pour les professionnels du monde entier ».
Cette vision se traduit en ambitions spécifiques, telles que : garantir l’agilité et l’efficacité opérationnelle des solutions ou assurer un accès sécurisé aux données.
Ces ambitions sont ensuite déclinées en objectifs concrets, assortis de résultats mesurables et d’échéances précises, afin de garantir un suivi rigoureux de leur progression. Par exemple, si l’ambition est d’améliorer l’accessibilité des données pour les équipes métiers, un objectif pourrait être de réduire de 50 % le temps nécessaire pour obtenir un rapport d’ici un an.
2.2 Equipe projet
L’équipe projet est temporaire, elle doit permettre de mettre en œuvre des cas d’usage de manière la plus efficace possible. Pour assurer l’efficacité de l’équipe il faut une équipe composée de l’ensemble des départements concernés. C’est un projet transverse dans lequel il ne peut pas avoir de silo. L’absence de silos est cruciale pour deux raisons : la rapidité de production, due aux interdépendances entre départements, et la pertinence des solutions proposées. Si les solutions ne sont pas partagées, il y a un risque qu’elles deviennent obsolètes, menant potentiellement à l’échec du projet.
2.3 Identifications des risques et macro chiffrage
Permet d’anticiper les imprévus, les challenges et d’assurer une mise en œuvre efficace. Faire un macro chiffrage du projet avant de le lancer permet d’estimer les ressources nécessaires et éventuellement d’arbitrer sur les solutions techniques envisagées. Cela permet d’éviter les mauvaises surprises budgétaires.
2.4 Feuille de route
La feuille de route définit les étapes clés et le planning, assurant une vision claire et une bonne coordination des actions. Elle commence par un projet pilote qui doit permettre de montrer rapidement les bénéfices de l’évolution des outils et de l’organisation.
3. Gouvernance
La gouvernance des données dans une Modern Data Stack définit les règles, les rôles et les processus pour garantir la qualité, la sécurité et la conformité des données. Elle assure une gestion efficace des données tout en les alignant avec les besoins de l’entreprise.
La gouvernance des données est un élément crucial pour toute organisation, indépendamment de son secteur d’activité. Elle assure :
- Conformité Réglementaire : Les entreprises sont soumises à diverses réglementations, notamment en matière de protection des données personnelles (comme le RGPD en Europe). Une gouvernance des données bien définie assure que l’organisation respecte ces obligations légales, évitant ainsi des sanctions potentielles.
- Qualité et Fiabilité des Données : Une gouvernance des données efficace garantit que les informations utilisées au sein de l’organisation sont précises, complètes et à jour. Cela est crucial pour des décisions éclairées, que ce soit pour la gestion opérationnelle, le marketing ou la stratégie d’entreprise.
- Sécurité des Données : La gouvernance des données inclut des politiques et des procédures pour protéger les informations sensibles contre les accès non autorisés, les fuites ou les cyberattaques. Cela est particulièrement important pour les entreprises qui gèrent des données personnelles ou financières.
- Efficacité Opérationnelle : Une bonne gouvernance des données permet de standardiser les processus de collecte, de stockage et d’utilisation des données. Cela réduit les redondances, améliore l’efficacité opérationnelle et permet une meilleure collaboration entre les différents départements de l’organisation.
- Prise de Décision Basée sur les Données : En assurant que les données sont de haute qualité et facilement accessibles, la gouvernance des données permet aux dirigeants et aux employés de prendre des décisions basées sur des informations fiables. Cela peut améliorer la gestion des ressources, l’optimisation des processus et l’innovation.
- Confiance des Parties Prenantes : Une gouvernance des données transparente et bien structurée renforce la confiance des parties prenantes, y compris les employés, les partenaires et les régulateurs. Cela peut améliorer la réputation de l’organisation et faciliter les relations avec les partenaires externes.
- Innovation et Compétitivité : En exploitant pleinement les données disponibles, les entreprises peuvent identifier de nouvelles opportunités d’innovation et améliorer leur compétitivité. Par exemple, l’analyse des données peut révéler des tendances de marché, des préférences clients ou des inefficacités opérationnelles, permettant ainsi d’adapter les stratégies et les produits en conséquence.
Comment le traduire en entreprise ?
Chart Data : La charte data est un document de référence permettant de consolider les grands principes, les règles, définitions et les bonnes pratiques en matière de gouvernance de la données afin de garantir qualité et sécurité dans les usages qu’il en est fait. C’est un document dynamique qui a vocation à tenir compte de l’évolution de la réglementation du système d’information, des pratiques de référence et des menaces. Dans ce document on retrouve aussi l’organisation cible autour de la modern data stack accompagné des rôles et responsabilités.
Contrat d’interface : Les échanges de données avec la Modern data Stack doivent être régis par des contrats d’interface. Le contrat d’interface comprend pour les données échangées :
- Description de l’interface : Le contrat doit détailler les caractéristiques techniques de l’interface, y compris les protocoles de communication (REST, SOAP, FTP, etc.), les formats de données (JSON, XML, CSV…), les points d’accès et les fonctionnalités proposées.
- Conditions d’utilisation : Les modalités d’accès, ainsi que les limitations et restrictions d’usage, doivent être clairement définies afin d’éviter toute utilisation abusive et d’assurer la sécurité des systèmes. Exemple :
- Les quotas d’appels ou de consommation des interfaces
- La gestion des accès et des authentifications (OAuth, clé API, certificats…)
- La conformité aux réglementations (RGPD, normes ISO, etc.)
- Responsabilités des parties : Chaque partie doit connaître ses obligations en matière de :
- Maintenance et évolution des interfaces
- Support technique et délais de résolution des incidents
- Sécurisation des échanges et protection des données sensibles
- Garanties et niveaux de service (SLA – Service Level Agreement) :
- Disponibilité des interfaces
- Temps de réponse moyen et délais maximums de traitement
- Gestion des interruptions et plan de reprise en cas d’incident
- Propriété intellectuelle (pour échanges avec externe) : Le contrat doit clarifier les droits de propriété intellectuelle relatifs à l’interface et aux données échangées, ainsi que les modalités d’exploitation.
- Durée et résiliation : Les modalités de durée, de reconduction et de résiliation du contrat doivent être spécifiées de manière précise, en incluant :
- Conditions de modification du contrat
- Modalités de résiliation anticipée et impacts sur les échanges de données
- Procédures de récupération ou de suppression des données en cas d’arrêt du service
4. Méthodologie d’implémentation par cas d’usage
Les cas d’usage garantissent une création de valeur continue en assurant des livraisons régulières, favorisant ainsi un retour d’expérience progressif et permettant d’ajuster la trajectoire au besoin.
Plutôt que de tenter une refonte globale et risquée (approche waterfall), nous recommandons d’adopter une approche agile, en avançant par cas d’usage.
Une approche par cas d’usages
Cette approche doit permettre de faciliter le pilotage des chantiers à mener en découpant en projets devant être réalisés dans un temps relativement court. Chaque cas d’usage identifie des utilisateurs, établit clairement la valeur attendue et le domaine des données concerné.
Par où commencer ?
Prioriser les cas d’usage en fonction de la facilité et de la complexité de développement, des bénéfices attendus et des risques associés.

Pourquoi cette approche ?
- Assurer un alignement avec les missions de l’entreprise en explicitant les contributions de chaque projet à l’atteinte des objectifs
- Permettre un pilotage efficace :
- les délais courts permettent de tirer des enseignements rapidement et d’éviter de pouvoir prendre des mesures rapidement pour rectifier les erreurs
- la valeur apportée et les objectifs clairs de chaque projet facilitent de pilotage à travers une mesure objective de l’atteinte des résultats attendus
Un découpage des données à prioriser ?
Le découpage en domaines métier assure de pouvoir découper les travaux de manière cohérente. Chaque domaine est relativement indépendant des autres, car il est porteur d’une logique métier. Les cas d’usage portent sur un domaine principal, ce qui permet d’aborder la question de l’organisation des données à partir d’une application concrète.
La réalisation du cas d’usage s’accompagne de travaux sur les référentiel des données, le catalogue des données et les règles en matière d’interopérabilité, d’archivage et de sécurité des données sur l’ensemble du domaine. Ces travaux s’appuient sur le cas d’usage pour valider la pertinence des choix sur un cas concret.
5. Projet pilote
Ce premier projet doit conduire à une phase de bilan pour en tirer les enseignements et ajuster les décisions sur les outils et l’organisation des équipes. Cette période est l’occasion de réduire la “dette technique” des infrastructures en place : amélioration de la qualité du code, établissement de conventions et bonnes pratiques devant être appliquées pour les cas d’usage suivants. Lors de cette phase un travail de FinOps est également réalisé, pour comprendre les coûts et éventuellement restructurer pour optimiser les dépenses.
Après cette période les cas d’usage sont déployés les uns après les autres. Une période dite “voiture balaie” doit être prévue pour faire migrer les données qui ne seraient pas encore sur la moderne data plateforme.
Nos fondamentaux pour un projet réussi
- Engagement du top management : “Ne pas cramer du gaz pour rien”. Sans engagement du top management, il existe un risque de développer un projet non aligné avec les objectifs de l’entreprise et donc qui n’aboutisse pas. Avant tout chose le projet doit être validé et compris par la direction.
- Alignement des départements : Casser les silos et assurer une collaboration efficace entre l’ensembles des départements. Les projets de Modern Data Stack sont des projets transverses. Ils sont mis en place par le technique pour des problématiques métier. Les équipes doivent travailler main dans la main pour converger vers une solution optimale.
- Comprendre le besoin, Poser les bonnes questions / Challenger : Comprendre les besoins réels, challenger les processus existants, “Et pourquoi ?” Utiliser les techniques de résolution de problème. La solution n’est peut être pas une migration vers une nouvelle plateforme mais peut être une question d’organisation et de gouvernance.
En adoptant cette approche structurée et pragmatique, nous assurons à nos clients un déploiement de Modern Data Stack réussi, aligné avec la vision stratégique de l’entreprise. Cette approche donne les fondamentaux aux entreprises pour être autonomes et assure une démarche pérenne. Elle leur fournit également les clés pour innover et grandir à l’avenir.