Comment mettre en œuvre les modèles Random Forest, SVM et Gradient Boosted pour les analyses temporelles | par Ryan Burke

 Comment mettre en œuvre les modèles Random Forest, SVM et Gradient Boosted pour les analyses temporelles | par Ryan Burke

Un tutoriel étape par étape avec des exemples

10 min lire

24 juillet 2021

Photo par Jonathan Petersson sur Unsplash

Dans ce billet, nous allons comparer plusieurs méthodes avancées pour aborder les analyses temps-événement (alias analyses de survie). Plus précisément, nous aborderons les modèles de survie Random Forest, Gradient Boosted et SVM.

Les analyses temps-événement sont des méthodes importantes pour nous aider à analyser les problèmes où il y a une composante temporelle à notre question de recherche. Comme leur nom l’indique, elles sont utilisées lorsque nous souhaitons comprendre la relation entre le temps et un événement donné.

Si ces études sont généralement menées dans le cadre de la recherche biologique (clinique, pharmaceutique), elles sont également applicables dans d’autres domaines (ingénierie, commerce, marketing). En voici quelques exemples :

  • Délai de réapparition de la maladie
  • Délai avant le décès
  • Délai avant le prochain achat
  • Délai d’annulation de l’adhésion

Une analyse temps-événement est un type de tâche de régression modifiée, mais elle est unique parce qu’une partie des données est incomplète (censurée). Pour comprendre ce que cela signifie, regardez l’image ci-dessous.


Source de l’article

A découvrir