[[probabilité]] et [[statistique]]
Corrélation
Note
L'utilisation de variables très corrélées diminuent la performance des modèles et des cluesterings car une partie de l'information est sur représenté (sur pondéré).
Variables quantitatives
La meilleure manière pour savoir si deux variables sont corrélées est une représenation graphique.
Coefficient de corrélation linéaire
Variables qualitatives
V de Cramer
- \(\gt 0.2\) :
- \(\gt 0.1\) :