Aller au contenu

Forêt aléatoire

library(randomForest)

Construire le modèle

rf = randomForest(cible ~ ., data = train)

Note

La variable à prédire doit être un facteur as.factor().

Option :

  • na.action = na.roughfix/na.omit remplace les valeurs manquantes par la médiane.
  • ytest = var_explique , xtest = vars_explicatives prédire les valeurs.
  • nodesize = 5 nombre de noeuds minimum.
  • importance = T évaluer l'importance des variables.
  • proximity = TRUE
  • ntree = 500 nombre d'arbres à construire.
  • mtry = 3 nombre de variables candidates.
  • replace = T
  • keep.forest = T garder la forêt en mémoire.

Taux d'erreur

plot(rf$err.rate[1:rf$ntree,1],type='l', xlab="nombre d'itérations",ylab='erreur')
lines(rf$test$err.rate[1:rf$ntree,1],type='l',lwd=2,col='red')

Importances des variables

rf.imp <- importance(rf,type = 1)[order(importance(rf, type = 1), decreasing = TRUE),]
rf.imp
varImpPlot(rf)