3 raisons d’utiliser Random Forest sur un réseau de neurones – en comparant l’apprentissage automatique et l’apprentissage en profondeur | par James Montantes
Random Forest est un meilleur choix que les réseaux de neurones pour plusieurs raisons principales. Voici ce que vous devez savoir en comparant l’apprentissage automatique à l’apprentissage en profondeur.
Les réseaux de neurones ont montré qu’ils surpassaient un certain nombre d’algorithmes d’apprentissage automatique dans de nombreux domaines de l’industrie. Ils continuent d’apprendre jusqu’à ce qu’il propose le meilleur ensemble de fonctionnalités pour obtenir des performances prédictives satisfaisantes. Cependant, un réseau de neurones mettra à l’échelle vos variables en une série de nombres qui, une fois que le réseau de neurones aura terminé la phase d’apprentissage, nous rendront les caractéristiques impossibles à distinguer.
Si tout ce qui nous importait était le prédiction, un réseau neuronal serait l’algorithme de facto utilisé tout le temps. Mais dans un contexte industriel, nous avons besoin d’un modèle qui puisse donner un sens à une caractéristique/variable aux parties prenantes. Et ces parties prenantes seront probablement n’importe qui d’autre que quelqu’un ayant une connaissance de l’apprentissage en profondeur ou de l’apprentissage automatique.
La forêt aléatoire et les réseaux de neurones sont des techniques différentes qui apprennent différemment mais peuvent être utilisées dans des domaines similaires. La forêt aléatoire est une technique de Apprentissage automatique tandis que les réseaux de neurones sont exclusifs à L’apprentissage en profondeur.
UNE Réseau neuronal est un modèle informatique vaguement basé sur le fonctionnement du cortex cérébral d’un humain pour reproduire le même style de pensée et de perception. Les réseaux de neurones sont organisés en couches composées de nœuds interconnectés qui contiennent une fonction d’activation qui calcule la sortie du réseau.
Les réseaux neuronaux sont un autre moyen d’apprentissage automatique dans lequel un ordinateur apprend à effectuer une tâche en analysant des exemples de formation. Comme le réseau neuronal est vaguement basé sur le cerveau humain, il se composera de milliers ou de millions de nœuds interconnectés. Un nœud peut être connecté à plusieurs nœuds de la couche en dessous de laquelle il reçoit des données, et à plusieurs nœuds au-dessus de lui qui reçoivent des données. Chaque point de données entrant reçoit un poids et est multiplié et ajouté. Un biais est ajouté si la somme pondérée est égale à zéro, puis transmis à la fonction d’activation.
Un réseau de neurones a 3 architectures de base :
- Réseaux d’anticipation à couche unique
- C’est le réseau le plus simple qui est une version étendue du perceptron. Il a des nœuds cachés supplémentaires entre la couche d’entrée et la couche de sortie.
2. Réseaux d’anticipation multicouches
- Ce type de réseau a une ou plusieurs couches cachées à l’exception de l’entrée et de la sortie. Son rôle est d’intervenir dans le transfert de données entre la couche d’entrée et la couche de sortie.
- Les réseaux de neurones récurrents sont similaires à ceux ci-dessus, mais sont largement adoptés pour prédire des données séquentielles telles que du texte et des séries chronologiques. Le réseau de neurones récurrents le plus célèbre est le ‘Modèle de mémoire à long et à court terme (LSTM).
Forêt aléatoire est un ensemble d’arbres de décision dans lequel le nœud final/feuille sera soit la classe majoritaire pour les problèmes de classification, soit la moyenne pour les problèmes de régression.
Une forêt aléatoire produira de nombreux arbres de classification et pour chaque sortie de cet arbre, nous disons l’arbre ‘voix’ pour cette classe. Un arbre est cultivé en suivant les étapes suivantes :
- Un échantillon aléatoire de lignes des données d’apprentissage sera prélevé pour chaque arbre.
- À partir de l’échantillon prélevé à l’étape (1), un sous-ensemble de caractéristiques sera prélevé pour être utilisé pour le fractionnement sur chaque arbre.
- Chaque arbre est cultivé au maximum spécifié par les paramètres jusqu’à ce qu’il atteigne un vote pour la classe.
La raison fondamentale d’utiliser une forêt aléatoire au lieu d’un arbre de décision est de combiner les prédictions de nombreux arbres de décision en un seul modèle. La logique est qu’un seul même composé de nombreux modèles médiocres sera toujours meilleur qu’un bon modèle. Il y a du vrai à cela étant donné la performance dominante des forêts aléatoires. Les forêts aléatoires sont moins sujettes au surapprentissage à cause de cela.
Un sur-ajustement peut se produire avec un modèle flexible comme les arbres de décision où le modèle mémorise les données d’entraînement et apprend également tout bruit dans les données. Cela le rendra incapable de prédire les données de test.
Une forêt aléatoire peut réduire la variance élevée d’un modèle flexible comme un arbre de décision en combinant plusieurs arbres en un seul modèle d’ensemble.
Random Forest est moins coûteux en calcul et ne nécessite pas de GPU pour terminer la formation. Une forêt aléatoire peut vous donner une interprétation différente d’un arbre de décision mais avec de meilleures performances. Les réseaux de neurones auront besoin de beaucoup plus de données qu’une personne ordinaire pourrait avoir sous la main pour être réellement efficaces. Le réseau de neurones décimera simplement l’interprétabilité de vos caractéristiques au point où elle n’aura plus de sens pour des raisons de performance. Bien que cela puisse sembler raisonnable pour certains, cela dépend de chaque projet.
Si l’objectif est de créer un modèle de prédiction sans se soucier des variables en jeu, utilisez certainement un réseau de neurones, mais vous aurez besoin des ressources pour le faire. Si une compréhension des variables est requise, que cela nous plaise ou non, ce qui se passe généralement dans cette situation, c’est que les performances devront subir un léger coup pour s’assurer que nous pouvons toujours comprendre comment chaque variable contribue au modèle de prédiction .
Quelque chose me manque ici?
S’il vous plaît laissez-moi savoir et je serai heureux de l’ajouter.
Source de l’article