Forêt aléatoire
library(randomForest)
Construire le modèle
rf = randomForest(cible ~ ., data = train)
Note
La variable à prédire doit être un facteur as.factor().
Option :
na.action = na.roughfix/na.omitremplace les valeurs manquantes par la médiane.ytest = var_explique , xtest = vars_explicativesprédire les valeurs.nodesize = 5nombre de noeuds minimum.importance = Tévaluer l'importance des variables.proximity = TRUEntree = 500nombre d'arbres à construire.mtry = 3nombre de variables candidates.replace = Tkeep.forest = Tgarder la forêt en mémoire.
Taux d'erreur
plot(rf$err.rate[1:rf$ntree,1],type='l', xlab="nombre d'itérations",ylab='erreur')
lines(rf$test$err.rate[1:rf$ntree,1],type='l',lwd=2,col='red')
Importances des variables
rf.imp <- importance(rf,type = 1)[order(importance(rf, type = 1), decreasing = TRUE),]
rf.imp
varImpPlot(rf)