Renversé dans une forêt de survie : Prédiction du désabonnement des clients en Python | par Heiko Onnen

Techniques
21 août 2024
211
46 minutes read

Modèle de forêt de survie conditionnelle avec PySurvival

Jeune amour rejeté Stock Photo – by iStock/vandervelden (istockphoto.com) sous licence standard

L’activité d’une entreprise taux d’attrition de la clientèle taux est le pourcentage de clients qui ont cessé de faire des affaires avec l’entreprise au cours d’une période donnée. La plupart d’entre eux ont dû commencer à préférer les produits d’un concurrent. Fidélisation de la clientèle cherchent à minimiser le taux d’attrition.

En règle générale, il est plus coûteux d’essayer d’attirer de nouveaux clients – en les détournant de la concurrence – que de conserver les clients existants. Un document de Bain & ; Company a indiqué qu’une “augmentation de 5 % de la rétention des clients produit plus de 25 % d’augmentation des bénéfices” dans le secteur des services financiers. (bain.com).

Notre objectif est de construire un modèle qui prédit le risque de désabonnement de chaque client. Afin de fournir des signaux d’alerte précoce à l’équipe de vente et de marketing, le modèle devrait identifier les profils de clients qui sont en corrélation avec un risque accru que le client soit bientôt tenté de se détourner de notre entreprise.

En plus de nos paquets de base tels que pandas et numpy, nous installerons et importerons le paquetage PySurvival bibliothèque.

Comme toujours, vous devriez créer un nouvel environnement virtuel avant d’installer un paquetage complexe, en particulier un paquetage avec des dépendances non-Python. PySurvival nécessite des redistribuables C++.

Pour installer PySurvival sur MacOS ou Linux, vous devez vérifier si gcc a déjà été installé sur votre machine :

Sur un Fenêtres l’installation nécessite quelques étapes supplémentaires. Il semble que les développeurs de PySurvival étaient inconscients du fait qu’une communauté d’utilisateurs de Python existe du côté Windows de la division des systèmes d’exploitation ; ou ils n’aiment tout simplement pas beaucoup les utilisateurs de Windows. Mais nous pouvons faire fonctionner PySurvival sur une machine Windows même si une installation par pip ne fonctionnerait pas. Suivez les étapes suivantes :

Créez votre nouvel environnement virtuel avec une version de Python ne dépassant pas 3.8. Par exemple dans conda : $ conda create -n yourchosenname python=3.8. La raison est que la version actuelle de PySurvival utilise une méthode tp_print qui a été dépréciée après la version 3.8.
Vous aurez besoin du compilateur C++ de Microsoft. S’il n’est pas déjà installé sur votre machine, une façon de l’obtenir est de télécharger les outils gratuits Visual Studio Build Tools à partir de : Télécharger les outils Visual Studio – Installer gratuitement pour Windows, Mac, Linux (microsoft.com). Dans le coin supérieur gauche de la fenêtre de sélection des outils de construction, sélectionnez l’option “Desktop development with C++”.

Téléchargez le paquetage PySurvival forké, qui fonctionne sous Windows, depuis ce dépôt GitHub : bacalfa/pysurvival : Paquet open source pour la modélisation de l’analyse de survie (github.com)[appreciations to its creator B. A. Calfa]. Sauvegardez le paquet téléchargé dans le dossier que vous souhaitez utiliser comme répertoire d’installation.
Activez votre nouvel environnement virtuel, par exemple : $ conda activate votre nom d’utilisateur
A partir de l’invite de commande, naviguez jusqu’au répertoire dans lequel vous avez sauvegardé et décompressé le paquet PySurvival.
À l’invite de commande, repackagez d’abord les fichiers téléchargés, puis installez le paquetage :

image par l’auteur

Renversé dans une forêt de survie : Prédiction du désabonnement des clients en Python | par Heiko Onnen

Modèle de forêt de survie conditionnelle avec PySurvival

3.1 Corrélations des caractéristiques

3.2 Ensemble de données de formation et de test

3.3 Modèle de forêt de survie conditionnelle – Le concept

3.4 Ajustement du modèle

3.5 Mesures de précision

3.6 Résultats du modèle : Importance des caractéristiques

3.7 Prédictions de désabonnement

Modèle de forêt de survie conditionnelle avec PySurvival

3.1 Corrélations des caractéristiques

3.2 Ensemble de données de formation et de test

3.3 Modèle de forêt de survie conditionnelle – Le concept

3.4 Ajustement du modèle

3.5 Mesures de précision

3.6 Résultats du modèle : Importance des caractéristiques

3.7 Prédictions de désabonnement

A découvrir

Le kit de survie de la Little...

Guide de survie du secteur de la...

Comment fabriquer des briques soi-même