Qu’est-ce que les tables de dimension en informatique décisionnelle ? Les dimensions sont des axes d’analyses. Les mêmes dimensions reviennent souvent dans les mêmes secteurs. Une dimension est similaire à un arbre, l’objectif est de joindre les tables de faits à une feuille. Avec les jointures entre les faits et les dimensions, les analystes calculent les agrégats avec un nœud, une branche ou l’ensemble de l’arbre.
Une dimension dans un modèle en étoile, est une table de dimension reliée à une ou plusieurs tables de faits. La liaison se fait par des clefs étrangères, au niveau de granularité le plus fin.
Définition des tables de dimension décisionnelle
Tout d’abord, la plupart du temps une table de dimension est dénormalisée. Cependant il faut toujours veiller à respecter la première forme normale. Il est préférable d’utiliser une clé physique générique sans aucun sens de type auto-incrémentée.
Même si les clefs de type fonctionnelles sont plus faciles à lire et à interpréter. En effet, la deuxième approche, avec des clés logiques permet de rendre plus simple la lecture et la maintenance due à l’évolution des dimensions. Elle simplifie aussi les jointures avec les tables de faits et réduit son volume de données.
Il existe certes différents types de processus servant à mette à jour les tables de dimension en informatique. Cependant, il est déconseillé de supprimer une ligne. Si vous n’avez pas envie de voir s’afficher des éléments d’une dimension non utiles, utiliser alors un champ de type « état » avec, par exemple des statuts comme « Actuel », « Obsolète », etc.
Les dimensions à variations lentes, ou Slowly changing dimensions (SCD) en Anglais, permettent de gérer l’évolution des tables de dimension de manière contrôlées.
Les tables de dimension sont des axes d’analyse structurés en hiérarchies
Afin de rendre plus simple le calcul d’agrégats ainsi que la production de rapports, créer des dimensions qui respectent les hiérarchies fonctionnelles en place dans l’entreprise. Elles reflètent l’activité modélisée et alimentent souvent un cube.
La dimension temps permet par exemple une hiérarchie sur quatre niveaux, comme :
- Année (2020, 2021, 2022)
- Trimestre (T1, T2, T3, T4)
- Mois (Janvier, Février, Mars, Avril, Mai, Juin, Juillet, Août, Septembre, Octobre, Novembre, Décembre)
- Jour (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31)
Exemple d’axe d’analyse de type géographique
Voici un autre exemple de tables de dimension informatique, cette fois avec une table de dimension géographique :
- Zone (Afrique, Asie, Amérique, Europe, Océanie)
- Pays : Afrique du Sud, Afghanistan, Albanie, Algérie, Allemagne, Andorre, Angola, Antigua-et-Barbuda. Arabie Saoudite, Argentine, Arménie, Australie, Autriche, Azerbaïdjan, Bahamas, Bahreïn, Bangladesh. Barbade, Belgique, Belize, Bénin, Bhoutan, Biélorussie, Birmanie, Bolivie, Bosnie-Herzégovine, Botswana, Brésil, etc.)
- Région (liste des régions ou états par pays)
- Ville (liste des villes rattachées aux régions)
D’une manière générale, délimiter la hiérarchie des dimensions de manière stricte. C’est à dire vérifier le rattachement de chaque région à son pays logique pour éviter les confusions. D’autre part, l’approche multidimensionnelle est plutôt naturelle car elle doit refléter la structure effective de l’entreprise.
Une organisation peut compter jusque des dizaines de dimensions. Avec un nombre trop important de dimensions, le modèle devient cependant trop complexe à analyser. Par exemple, utiliser les attributs sur les dimensions informatiques pour distinguer certains éléments. Créer ensuite des hiérarchies alternatives dans une dimension existante.
Il faut garder en tête la valeur ajoutée d’un système multidimensionnel. La pertinence des dimensions constitue le socle de l’efficacité d’un système d’information et d’aide à la décision. Le croisement de celles-ci permet d’analyser les données stockées dans les tables de faits et autres KPIs.
D’autre part, les tables de dimensions et les tables de faits permettent de construire des cubes OLAP. Cubes qui constituent la dernière étape de stockage des données dans le processus décisionnel.
Soyez le premier à commenter