Aller au contenu

Système d'Information Décisionnel (SID)

Les quatres fonctions d'un SID :

  • collecter.
  • intégrer.
  • diffuser.
  • présenter.

Deux types de bdd de données sont utilisés, celle :

  • écrite, peu lue > normaliser le + possible.
  • peu écrite, lue > améliorer l'accés aux données.

Organisation d'un SID


title: Simple sample

stateDiagram-v2 [] --> Still Still --> []

Still --> Moving
Moving --> Still
Moving --> Crash
Crash --> [*]
Machines
                        _________________           _________________           ______________________
                       | - Fichiers      |         | Operating Data  |         | Entrepôt de Données  |          
Utilisateurs <--OLTP-->| - Bases métiers |--ETL--->| Store (ODS)     |--ETL--->|  Décisionnel (EDD)   |<--OLAP-- Utilisateurs du 
                       |_________________|         |_________________|         |______________________|          Décisionnel
Type de bdd Objectif Spécificités
bdd métiers, fichiers Bdd de l'applications qui doit être réactive Uniquement les dernières données et les informations utiles pour la saisie.
ODS Bdd historisée et complète Toutes les données brutes
EDD Bdd optimisée pour l'analyse (source d’information commune, homogène, normalisée et fiable) Données agréées grâce à des indicateurs précalculées.

Les spécifités des données stockés en fonction du type de bases :

Bdd métiers, fichiers ODS EDD ou DWH
Hétérogènes Hétérogènes Homogènes
Redondantes Redondantes Non redondantes
Volatiles Historisées Historisées
Non agrégées Non agrégées Agrégées

Les spécificités des types de bases données :

Type de bases de données Type de données stockées Optimiser pour
Datamarts et Entrepôt Spécifique à un métier, un usage écriture et les modifications (OLTP)
Données Décisionnel Transversale analyse (OLAP)

Extract Transform Load (ETL)

OnLine Transactional Processiong (OLTP)

OnLine Analytical Processing (OLAP) les deux principaux types d'OLAP sont :

  • Multidimensional OLAP Modèle multidimensionnel (MOLAP) une table de fait avec les indicateurs entourée de cubes (dimensions) d'un seul niveau.
  • ROLAP.

Système de Gestion de Base de Données Relationnelle (SGBDR)

Note

Les machines utilisées sont adaptées à leur rôle. Par exemple, pour le passage de l'ODS au DWH, il est préférable de charger puis transformer pour utiliser la puissance de traitement de l'EDD.

Les bases de donnés et leurs types associés

Datamart entrepôt de données décisionnel spécialisé dans un domaine.

Data lake Entrepôt de données brutes non structurées accessible en lecture seule.

Type de données Exemples
Structurées Texte, nombre, date/heure
Non structurées Image, son, vidéo

Les tables d'un EDD

Les types de tables :

  • De dimensions, table qui contient les informations qui décrivent l'enregistrement de la table de fait. Elle sert notamment à filtrer les données de la table de fait.
  • De fait, table qui contient les indicateurs et les données mesurables sur les faits et les événements.

Note

Généralemenent, une table de fait est associés à plusieurs tables de dimensions.

Forme normale (bases de données relationnelles)

Objectif : Normaliser les données pour éviter les anomalies de lecture, la redondance et la contre performance et, permettre d'avoir une bdd robuste et cohérente.

Cela s'effectue en :

  • limitant les redondances.
  • diminuant la volumétrie.
  • interdisant les incohérences.

Un modèle Conceptuel de Données est constitué de :

  • Entité (objet à modéliser) est caractérisée par des propriétés.

    • si une des propriétés est unique et discriminante, elle est nommée identifiant.
    • un individu d'une entité s'appelle une occurence.
    • l'association est le lien entre les entités.

Termes du domaine intéressants non définis

  • Framework comme Hadoop Distributed File System (HDFS) un système de fichiers distribué.
  • Calcul paralléle distribué.
  • Map Reduce.
  • Réglémentation Générale pour la Protection des Données (RGPD).
  • Schema Spy, outils libre pour documenter le schéma relationnel.
  • Méthode Merice, méthode de gestion de projet dédiée à la conception de la structure informatique.