Comment mettre en œuvre les modèles Random Forest, SVM et Gradient Boosted pour les analyses temporelles | par Ryan Burke
Dans ce billet, nous allons comparer plusieurs méthodes avancées pour aborder les analyses temps-événement (alias analyses de survie). Plus précisément, nous aborderons les modèles de survie Random Forest, Gradient Boosted et SVM.
Les analyses temps-événement sont des méthodes importantes pour nous aider à analyser les problèmes où il y a une composante temporelle à notre question de recherche. Comme leur nom l’indique, elles sont utilisées lorsque nous souhaitons comprendre la relation entre le temps et un événement donné.
Si ces études sont généralement menées dans le cadre de la recherche biologique (clinique, pharmaceutique), elles sont également applicables dans d’autres domaines (ingénierie, commerce, marketing). En voici quelques exemples :
- Délai de réapparition de la maladie
- Délai avant le décès
- Délai avant le prochain achat
- Délai d’annulation de l’adhésion
Une analyse temps-événement est un type de tâche de régression modifiée, mais elle est unique parce qu’une partie des données est incomplète (censurée). Pour comprendre ce que cela signifie, regardez l’image ci-dessous.
Source de l’article