Modélisation décisionnelle ascendante de Ralph Kimball




La conception décisionnelle ascendante de Ralph Kimball, auteur et expert reconnu dans le domaine des entrepôts de données, est le partisan d’une approche de la conception décisionnelle d’entrepôt de données du bas vers le haut. Cette méthode est aussi appelée « Bottom-Up ». Dans l’approche ascendante, les magasins de données ou datamarts sont donc créés pour fournir des rapports et une capacité d’analyse dédiés à certains processus métiers spécifiques, donc plus faciles à utiliser que des entrepôts de données complexes. 

Dans la méthodologie de Ralph Kimball, le processus bottom-up est le résultat d’une première entreprise axée sur une analyse des processus d’affaires pertinents à modéliser.

 

Des magasins de données spécialisés

Les magasins de données contiennent les dimensions axes d’analyses et les faits ou mesures. Les faits peuvent contenir soit des données atomiques c’est à dire à un niveau fin, soit des données agrégées. Il modélise souvent un domaine d’activité très spécifique comme les ventes ou la production. Ces magasins de données peuvent être intégrés à une solution décisionnelle afin de créer un entrepôt de données complet.

Cette intégration entre différents entrepôts de données est mise en œuvre par ce que Kimball appelle une architecture d’entrepôt de données en bus. Elle est permise par une collection de dimensions conformes, qui sont des dimensions partagées (de manière spécifique) entre deux dépôts de données ou plus, permettant des analyses croisées sur plusieurs domaines métiers ou processus.

 

Le Drill Across de Raplh Kimball

L’intégration des données transverses dans l’entrepôt de données est basée sur les dimensions conformes qui représentent des points d’entrée entre les data marts. L’intégration effective de deux ou plusieurs data marts se fait alors par un processus appelé « Drill Across », c’est un forage latéral qui regroupe des données métiers différentes mais à un même niveau de granularité et utilisant les mêmes dimensions. Les dimensions souvent utilisées car transverses à l’entreprise sont par exemple l’axe Temps, Clients ou Produits.

Maintenir une gestion précise de l’architecture de l’entrepôt de données est essentiel pour l’intégrité des données. La tâche de gestion la plus importante est de faire en sorte que les dimensions entre les data marts soient compatibles et donc mises à jour en parallèle. Certains analystes estiment que c’est un avantage de la méthode Kimball que l’entrepôt de données finisse par être segmenté en un certain nombre de data marts logiques et cohérents, plutôt qu’en un grand modèle centralisé et souvent complexe.

 

Une vision en silo connectés favorable aux itérations

Les données de l’entreprise peuvent être analysées dès la fin de la création des premiers magasins de données, la méthode permet une approche exploratoire et itérative pour la construction de l’entrepôt. Par exemple, l’effort de chargement des données est développé pour les ventes, avec un entrepôt de données spécifique.

La suite du projet décisionnel peut continuer pour la Production, une analyse conjointe peut mettre en exergue la corrélation entre la capacité de production et les ventes quotidiennes. Cette vision de Ralph Kimball du monde décisionnel est favorable aux itérations et permet de produire des projets décisionnels domaine par domaine.