Master Data Management (MDM)
Le rôle fondamental de lintégration de données dans une stratégie de gestion
des données de référence (MDM)
QUEST-CE QUUNE « MASTER DATA » ?
Une master data est un enregistrement unique qui sert de RÉFÉRENCE pour toute
lentreprise.
Par exemple, le nom dun client, le code dun produit, un numéro de compte
sont des données de référence.
DÉFINITION DU MDM :
Méthode de traitement des données, lancée par le cabinet Meta Group, destinée
à qualifier et à uniformiser le mode de description des informations pour en
garantir une prise en compte correcte. Elle regroupe l'ensemble des données
dites "de base" (ou Master Data) au sein d'un référentiel. Celui-ci servira
alors de modèle lors de la mise à jour de tel ou tel système ou base de données.
Cette démarche repose sur : -lunification des données dans un
référentiel unique -lactualisation des données, grâce à la centralisation
des mises à jour -la fiabilité et la propreté des données (pas de doublons,
pas de recoupements)
-la validation des données dans le respect des droits et règles de sécurité
propres à lentreprise
-la disponibilité des données et leur propagation à travers toute lentreprise
Lidée dun référentiel qui hébergerait toutes les données de référence (ou
master data) de lentreprise nest pas nouvelle. Après des années dinformatique
distribuée, de prolifération et dimbrication de systèmes hétérogènes supportant
les activités métiers et la gestion de lentreprise, pouvoir disposer dune
base centralisée, dépositaire exclusive de « la vérité », est un rêve partagé
par tous les responsables de systèmes dinformation. Un rêve que de nouveaux
impératifs de réactivité dans des contextes de fusion-acquisition, de gestion
de performance, de conformité réglementaire
propulsent au rang durgente
nécessité. Labsence de gestion unifiée des données de référence se traduit
au quotidien par des pertes defficacité opérationnelle qui ont un impact direct
sur la performance globale de lentreprise.
Partant du principe quil est impossible de faire abstraction de la diversité,
de lhétérogénéité et de la complexité des systèmes, applications et processus
existants, mettre en place une gestion performante des données de référence
pose toute une série de questions difficiles à résoudre sans méthode et outils
appropriés : comment aller chercher les données de référence là où elles sont
produites ? Comment sassurer de leur qualité et de leur homogénéité alors quelles
sont issues de systèmes différents ou dinstances distinctes dun même système
? Comment les actualiser et, lorsquelles sont modifiées, propager les changements
à travers toute lentreprise ?
Une problématique dintégration de données
A lénumération des questions qui précèdent, on comprend aisément pourquoi
toute initiative de MDM est aussi et peut-être avant tout une problématique
dintégration de données. Sil existe de multiples approches, propriétaires
ou développées par chaque entreprise, pour gérer les données de référence, toutes
reposent sur la construction dun référentiel (unique ou par catégorie de données
de référence) et ont fondamentalement les mêmes besoins daccessibilité, de
disponibilité, de qualité, de cohérence, dauditabilité et de sécurité des données.
Dans son article*, lanalyste David Waddington de Ventana Research estimait
que « la plate-forme dintégration de données dInformatica est particulièrement
bien placée pour répondre à ces besoins », notamment dans les contextes de déploiement
darchitectures orientées-services (SOA). PowerCenter offre, en effet, une plate-forme
unifiée fournissant des services de données partagés, utilisables dans de multiples
processus et dans des environnements de données hétérogènes, ainsi que des fonctionnalités
de développement collaboratif que lauteur considère comme « des éléments décisifs
pour supporter le MDM ».
Les étapes du processus
Une démarche complète de gestion et de maintenance des données de référence
comprend les étapes suivantes :
1 Définir un responsable pour chaque catégorie de données de référence (clients,
produits, fournisseurs, structures organisationnelles, etc.). Ce responsable
devient le garant de la qualité et de lactualisation des données vis-à-vis
de tous les systèmes, processus et personnes qui utilisent cette ressource partagée.
2 Extraire des divers systèmes opérationnels, transactionnels et analytiques
les données de référence de chaque domaine pour les charger dans des référentiels
par domaine ou dans un « hub » central.
3 Appliquer les normes de qualité de données pour obtenir un ensemble de
données propres (en particulier en dédupliquant les enregistrements).
4 Définir les règles de réconciliation et de rationalisation des données
de référence. Lobjectif est dobtenir pour chaque domaine une liste/hiérarchie
optimale et compréhensible pour les utilisateurs, quil sagisse dindividus
ou dapplications.
5 Synchroniser les systèmes opérationnels et de reporting avec les données
gérées dans le(s) référentiel(s) de données de référence, afin de garantir que
tous les systèmes
Quelle différence entre le data warehousing et le MDM ?
Un data warehouse regroupe les données issues de plusieurs sources en vue
dalimenter des applications de business intelligence, de reporting et danalyse.
Sil unifie les données provenant des systèmes sources, le data warehouse nest
pas conçu pour renvoyer vers ces sources les données modifiées. En dautres
termes, un data warehouse fait appel à un processus mono-directionnel alors
que le MDM nécessite un processus bidirectionnel garantissant la synchronisation
des données entre le référentiel et les systèmes sources/cibles rattachés.
utilisent, à tout moment, les bonnes
données (même valeur, même version).
6. Suivre les mises à jour/modifications de données de référence dans les
systèmes participants et reconduire systématiquement les 5 étapes précédentes
du processus, de façon à maintenir lexhaustivité, la qualité et la fraîcheur
des données de la ressource partagée.
Principales caractéristiques dune solution de MDM
En regard des étapes décrites ci-dessus, une solution de MDM (quil sagisse
dune plate-forme générique prenant en charge toutes les catégories de données
de référence ou dune solution spécifique à une seule catégorie) doit impérativement
:
1 Permettre de définir des rôles et des droits daccès individuels pour chaque
étape du processus de gestion des données de référence.
2 Offrir des fonctionnalités ETL complètes pour extraire les données de référence
des différentes sources et les charger dans le référentiel.
3 Fournir des services de nettoyage de données pour comparer et dédupliquer
les enregistrements.
4 Offrir des capacités de collaboration pour coordonner les décisions de
réconciliation et de rationalisation des données de référence.
5 Prendre en charge la détection des changements, la synchronisation bidirectionnelle
et la réplication des données, afin de répercuter dans les systèmes concernés
tout changement effectué dans le référentiel.
6. Permettre le contrôle de version et la validation des changements dans
lensemble du système. La solution doit en particulier permettre de recréer
un état antérieur des données et de modéliser des états futurs.
Recommandation
Dans larticle cité*, Ventana Research estime que les clients existants dInformatica
doivent considérer PowerCenter 8 comme une extension nécessaire de leurs efforts
dintégration de données pour supporter le MDM. Les entreprises doivent concevoir
leur stratégie de MDM de façon à prendre en compte lintégration de données
et à sassurer quelle répond à tous leurs besoins de migration, de réplication
et de synchronisation des données de référence. Ceux qui recherchent une solution
dintégration de données flexible doivent considérer Informatica comme la base
qui supportera leur architecture dinformation et un élément de soutien pour
le MDM.
A propos dInformatica
Informatica Corporation est un fournisseur majeur de solutions dintégration
de données dentreprise. A l'aide des produits Informatica, les organisations
de tous types peuvent accéder, intégrer, migrer et consolider les données générées
et utilisées par lensemble de leurs systèmes, processus et collaborateurs pour
réduire la complexité, garantir la cohérence et accroître la performance globale
de leurs activités.
* VentanaMonitor : « Informatica sattaque au MDM », David Waddington, Ventana
Research, 18 avril 2006
Informatica France : Immeuble Le Linéa, rue du Général Leclerc - 92047 Paris
La Défense Cedex (France)
Tél. : + 33 1 41 38 92 00 Fax : + 33 1 41 38 92 01 www.informatica.com/fr
Informatica Division Data Quality : Wilson House, Fenian Street Dublin
2 Irlande
Tél. : +353 1 4004900 - Fax : +353 1 4004999 -www.informatica.com
Siège international : 100 Cardinal Way, Redwood City, CA 94063 (USA)
Tél. : + 1 650 385 5000 Fax : + 1 650 385 5500 N° Vert USA : + 1 800 970
1179 www.informatica.com
Informatica dans le monde : Allemagne Australie Belgique Canada Etats-Unis
France Japon Pays-Bas Royaume-Uni Singapour Suisse
© 2006 Informatica Corporation. Tous droits réservés. Imprimé en France.
Informatica, le logo Informatica, le slogan «The Data Integration Company»,
sont des marques commerciales ou des marques déposées dInformatica Corporation
aux Etats-Unis et/ou dans dautres pays. Les autres noms de sociétés ou de produits
cités sont la propriété de leurs détenteurs respectifs et peuvent avoir fait
lobjet dun dépôt de marque.
© 2007 Informatica Corporation. Tous droits réservés.
Informatica, le logo Informatica, la signature The Data Integration Company,
PowerCenter, Informatica Data Quality, Informatica Data Explorer et Informatica
Complex Data Exchange sont des marques commerciales ou des marques déposées
d'Informatica Corporation aux Etats- Unis et/ou dans dautres pays. Les
autres noms de sociétés ou de produits cités sont la propriété de leurs
détenteurs respectifs et peuvent avoir fait lobjet d'un dépôt de marque.