Système d'Information Décisionnel (SID)
Les quatres fonctions d'un SID :
- collecter.
- intégrer.
- diffuser.
- présenter.
Deux types de bdd de données sont utilisés, celle :
- écrite, peu lue > normaliser le + possible.
- peu écrite, lue > améliorer l'accés aux données.
Organisation d'un SID
title: Simple sample
stateDiagram-v2 [] --> Still Still --> []
Still --> Moving
Moving --> Still
Moving --> Crash
Crash --> [*]
Machines
_________________ _________________ ______________________
| - Fichiers | | Operating Data | | Entrepôt de Données |
Utilisateurs <--OLTP-->| - Bases métiers |--ETL--->| Store (ODS) |--ETL--->| Décisionnel (EDD) |<--OLAP-- Utilisateurs du
|_________________| |_________________| |______________________| Décisionnel
Type de bdd | Objectif | Spécificités |
---|---|---|
bdd métiers, fichiers | Bdd de l'applications qui doit être réactive | Uniquement les dernières données et les informations utiles pour la saisie. |
ODS | Bdd historisée et complète | Toutes les données brutes |
EDD | Bdd optimisée pour l'analyse (source d’information commune, homogène, normalisée et fiable) | Données agréées grâce à des indicateurs précalculées. |
Les spécifités des données stockés en fonction du type de bases :
Bdd métiers, fichiers | ODS | EDD ou DWH |
---|---|---|
Hétérogènes | Hétérogènes | Homogènes |
Redondantes | Redondantes | Non redondantes |
Volatiles | Historisées | Historisées |
Non agrégées | Non agrégées | Agrégées |
Les spécificités des types de bases données :
Type de bases de données | Type de données stockées | Optimiser pour |
---|---|---|
Datamarts et Entrepôt | Spécifique à un métier, un usage | écriture et les modifications (OLTP) |
Données Décisionnel | Transversale | analyse (OLAP) |
Extract Transform Load (ETL)
OnLine Transactional Processiong (OLTP)
OnLine Analytical Processing (OLAP) les deux principaux types d'OLAP sont :
- Multidimensional OLAP Modèle multidimensionnel (MOLAP) une table de fait avec les indicateurs entourée de cubes (dimensions) d'un seul niveau.
- ROLAP.
Système de Gestion de Base de Données Relationnelle (SGBDR)
Note
Les machines utilisées sont adaptées à leur rôle. Par exemple, pour le passage de l'ODS au DWH, il est préférable de charger puis transformer pour utiliser la puissance de traitement de l'EDD.
Les bases de donnés et leurs types associés
Datamart entrepôt de données décisionnel spécialisé dans un domaine.
Data lake Entrepôt de données brutes non structurées accessible en lecture seule.
Type de données | Exemples |
---|---|
Structurées | Texte, nombre, date/heure |
Non structurées | Image, son, vidéo |
Les tables d'un EDD
Les types de tables :
- De dimensions, table qui contient les informations qui décrivent l'enregistrement de la table de fait. Elle sert notamment à filtrer les données de la table de fait.
- De fait, table qui contient les indicateurs et les données mesurables sur les faits et les événements.
Note
Généralemenent, une table de fait est associés à plusieurs tables de dimensions.
Forme normale (bases de données relationnelles)
Objectif : Normaliser les données pour éviter les anomalies de lecture, la redondance et la contre performance et, permettre d'avoir une bdd robuste et cohérente.
Cela s'effectue en :
- limitant les redondances.
- diminuant la volumétrie.
- interdisant les incohérences.
Un modèle Conceptuel de Données est constitué de :
-
Entité (objet à modéliser) est caractérisée par des propriétés.
- si une des propriétés est unique et discriminante, elle est nommée identifiant.
- un individu d'une entité s'appelle une occurence.
- l'association est le lien entre les entités.
Termes du domaine intéressants non définis
- Framework comme Hadoop Distributed File System (HDFS) un système de fichiers distribué.
- Calcul paralléle distribué.
- Map Reduce.
- Réglémentation Générale pour la Protection des Données (RGPD).
- Schema Spy, outils libre pour documenter le schéma relationnel.
- Méthode Merice, méthode de gestion de projet dédiée à la conception de la structure informatique.