Statistique dictionnaire
[[statistique]]
A
- Apprentissage profond (deep learning) algorithme d’apprendre et de s’améliorer de manière autonome.
- Area Under the Curce (AUC)
B
- Barycentre (ou centre de gravité) moyenne arithmétique de plusieurs points.
- Bootstrap-aggregating (bagging) échantillon tiré aléatoirement parmi la population.
C
- Classification effectuer de la prédiction sur des groupes d’individus. La variable d’intérêt est qualitative.
- Classification non supervisée
- Classification supervisée
- Cluestering créer des groupes d’individus avec des caractéristiques proches.
- Cohorte groupe d’individus.
- Colinéarité (Multicolinéarité) relation linéaire entre deux (ou plusieurs variables).
- Corrélation intensité de la liaison entre deux variables. La corrélation est une forme normalisée de la covariance.
- Courbe de Lift
- Covariance quantification de l’écart entre deux variables.
E
- Ecart-type (variance)
- Estimation
I
- Indice de Gini mesure statistique de la dispersion d’une distribution.
- Inertie
- Information de Fisher
Q
- Quantile (quartile;décile) valeur qui sépare en n% (25%, 10%) l’échantillon.
M
- Maximum de vraisemblance
- Médiane valeur qui sépare en 50% l’échantillon.
- Modèle statistique description mathématique approximative du mécanisme à travers les observations.
- Moyenne indicateur de tendance centrale pour une variable quantitative.
P
- Probabilité
- p-value probabilité d’obtenir une valeur aussi extrême sous h0.
R
- Rapport de côte (odd ratio) différence de probabilité entre deux groupes. Mesurer l’influence d’une variable qualitative sur une autre qualitative.
- Régression prédire une variable continue.
- ROC Utilité : évaluation et de comparaison des modèles de prédiction de deux classes. Evaluer les performance des modèles de prédiction de deux classes. ´
T
- Test
V
- Validation croisée créer un échantillon apprentissage et de test.
- VIF (Variance Inflation Factor) détecter les multi-colinéarités entre les variables.
- Vraisemblance mesure l’adéquation