Aller au contenu

Statistique dictionnaire

[[statistique]]

A

  • Apprentissage profond (deep learning) algorithme d’apprendre et de s’améliorer de manière autonome.
  • Area Under the Curce (AUC)

B

  • Barycentre (ou centre de gravité) moyenne arithmétique de plusieurs points.
  • Bootstrap-aggregating (bagging) échantillon tiré aléatoirement parmi la population.

C

  • Classification effectuer de la prédiction sur des groupes d’individus. La variable d’intérêt est qualitative.
  • Classification non supervisée
  • Classification supervisée
  • Cluestering créer des groupes d’individus avec des caractéristiques proches.
  • Cohorte groupe d’individus.
  • Colinéarité (Multicolinéarité) relation linéaire entre deux (ou plusieurs variables).
  • Corrélation intensité de la liaison entre deux variables. La corrélation est une forme normalisée de la covariance.
  • Courbe de Lift
  • Covariance quantification de l’écart entre deux variables.

E

  • Ecart-type (variance)
  • Estimation

I

  • Indice de Gini mesure statistique de la dispersion d’une distribution.
  • Inertie
  • Information de Fisher

Q

  • Quantile (quartile;décile) valeur qui sépare en n% (25%, 10%) l’échantillon.

M

  • Maximum de vraisemblance
  • Médiane valeur qui sépare en 50% l’échantillon.
  • Modèle statistique description mathématique approximative du mécanisme à travers les observations.
  • Moyenne indicateur de tendance centrale pour une variable quantitative.

P

  • Probabilité
  • p-value probabilité d’obtenir une valeur aussi extrême sous h0.

R

  • Rapport de côte (odd ratio) différence de probabilité entre deux groupes. Mesurer l’influence d’une variable qualitative sur une autre qualitative.
  • Régression prédire une variable continue.
  • ROC Utilité : évaluation et de comparaison des modèles de prédiction de deux classes. Evaluer les performance des modèles de prédiction de deux classes. ´

T

  • Test

V

  • Validation croisée créer un échantillon apprentissage et de test.
  • VIF (Variance Inflation Factor) détecter les multi-colinéarités entre les variables.
  • Vraisemblance mesure l’adéquation