Aller au contenu

[[probabilité]] et [[statistique]]

Corrélation

Note

L'utilisation de variables très corrélées diminuent la performance des modèles et des cluesterings car une partie de l'information est sur représenté (sur pondéré).

Variables quantitatives

La meilleure manière pour savoir si deux variables sont corrélées est une représenation graphique.

Coefficient de corrélation linéaire

Variables qualitatives

V de Cramer

  • \(\gt 0.2\) :
  • \(\gt 0.1\) :

Variable qualitative et quantitative