Entrepôt de Données ou Data Warehouse

Quelle définition pour un entrepôt de données ou Data Warehouse? Un entrepôt de données est une base de données multidimensionnelle. Cette base stocke une importante quantité de données. Les entreprises et les organisations d’une certaine taille ou chiffre d’affaires utilisent les entrepôts de données.

Tout d’abord, le système décisionnel charge les données depuis les systèmes sources. Ces sources sont des bases de données transactionnelles hétérogènes. Tous les domaines fonctionnels sont concernés : ERP, Comptabilité, Ventes, Marketing, Stocks, Ressources humaines, Finance, etc.

Ces données opérationnelles proviennent d’ applicatifs métiers, donc de directions et de périmètres fonctionnels différents. Par ailleurs, un entrepôt a pour vocation d’offrir une vue transverse des activités pour accélérer la prise de décision.

Quelle définition pour un Entrepôt de Données ou Data Warehouse ?

Un entrepôt de données contient des données hiérarchisées et structurées

Premièrement, un logiciel ETL alimente les données depuis les bases de données opérationnelles et bases OLTP ou de production. ETL signifie “Extract Transform and Load” en Anglais.

Un logiciel d’intégration de données permet de charger, de contrôler et de structurer les données sources. Cette intégration va de paire avec l’application de règles de gestion.

Les données d’un Data Warehouse transitent depuis les bases sources vers un ODS pour “Operational Data Store” ou Magasin de données opérationnelles, puis vers le Data Warehouse et enfin vers les “Data Marts” ou Magasins de données.

Le magasin de données opérationnelles ou ODS pour Operational Data Store

Ensuite, les données dans l’ODS sont une simple copie des données des bases de production OLTP (On Line Transactional Processing). Elles proviennent de fichiers ou de connexions directes aux bases de données via des connecteurs (ODBC, OLE, JDBC, etc.)

La structuration des données dans l’entrepôt de données

En d’autres termes, le Data Warehouse et son système hiérarchise et structure les données via des axes d’analyses. Il organise les données via une dimension temporelle  et les contrôle par rapport à un référentiel d’entreprise avec application de règles de gestion. Les données à ce stade sont composées des dimensions de l’entrepôt appelées aussi référentiel ainsi que de tables de faits. Les faits sont des mesures ou indicateurs proprement dits avec des montants ou des chiffres. Les dimensions sont aussi appelées des axes d’analyses. On parle à ces niveaux de bases de données OLAP (On Line Analytical Processing) aussi appelées cubes multidimensionnels.

Les données dans le magasin de données ou Datamart

Finalement, les magasins de données stockent et regroupent les données par périmètres fonctionnels. Ces périmètres constituent un sous-ensemble du Data Warehouse. C’est une vue fonctionnelle sur un périmètre et des informations métiers plus précises. Le Reporting à la demande avec Microsoft Excel utilise les informations stockées dans l’entrepôt de données et les magasins de données.

En effet, d’autres outils permettent ces analyses comme Power BI, QlikView ou Tableau Software entre autres. Ces outils utilisent des requêtes dynamiques, des tableaux de bords opérationnels ou stratégiques.

Pour aller plus loin voici un article sur les systèmes d’information et d’aide à la décision au sens large:

Soyez le premier à commenter

Laisser un commentaire