Analyse de survie – Wikipédia
Analyse de survie est une branche de la statistique pour analyser la durée attendue jusqu’à ce qu’un ou plusieurs événements se produisent, comme la mort d’organismes biologiques et la défaillance des systèmes mécaniques. Ce sujet s’appelle théorie de la fiabilité ou analyse de fiabilité en ingénierie, analyse de la durée ou modélisation de la durée en économie, et analyse de l’historique des événements en sociologie. L’analyse de survie tente de répondre à certaines questions, comme quelle est la proportion d’une population qui survivra au-delà d’un certain temps? Parmi ceux qui survivent, à quelle vitesse mourront-ils ou échoueront-ils? Peut-on prendre en compte plusieurs causes de décès ou d’échec? Comment des circonstances ou caractéristiques particulières augmentent-elles ou diminuent-elles la probabilité de survie?
Pour répondre à ces questions, il est nécessaire de définir la «durée de vie». Dans le cas de la survie biologique, la mort est sans ambiguïté, mais pour la fiabilité mécanique, la défaillance peut ne pas être bien définie, car il peut bien y avoir des systèmes mécaniques dans lesquels la défaillance est partielle, une question de degré ou non localisée dans le temps. Même dans les problèmes biologiques, certains événements (par exemple, une crise cardiaque ou une autre défaillance d’organe) peuvent avoir la même ambiguïté. La théorie exposée ci-dessous suppose des événements bien définis à des moments précis; d’autres cas peuvent être mieux traités par des modèles qui tiennent explicitement compte d’événements ambigus.
Plus généralement, l’analyse de survie implique la modélisation des données time to event; dans ce contexte, la mort ou l’échec est considéré comme un « événement » dans la littérature d’analyse de survie – traditionnellement, un seul événement se produit pour chaque sujet, après quoi l’organisme ou le mécanisme est mort ou brisé. Événement récurrent ou événement répété les modèles assouplissent cette hypothèse. L’étude des événements récurrents est pertinente pour la fiabilité des systèmes et dans de nombreux domaines des sciences sociales et de la recherche médicale.
Introduction à l’analyse de survie[[[[Éditer]
L’analyse de survie est utilisée de plusieurs manières:
- Décrire les temps de survie des membres d’un groupe
- Pour comparer les temps de survie de deux ou plusieurs groupes
- Décrire l’effet des variables qualitatives ou quantitatives sur la survie
Définitions des termes courants dans l’analyse de survie[[[[Éditer]
Les termes suivants sont couramment utilisés dans les analyses de survie:
- Événement: décès, apparition de la maladie, récurrence de la maladie, rétablissement ou autre expérience d’intérêt
- Temps: Le temps écoulé entre le début d’une période d’observation (telle qu’une intervention chirurgicale ou le début du traitement) jusqu’à (i) un événement, ou (ii) la fin de l’étude, ou (iii) la perte de contact ou le retrait de l’étude.
- Censurer / Observation censurée: Si un sujet n’a pas d’événement pendant le temps d’observation, il est décrit comme censuré. Le sujet est censuré dans le sens où rien n’est observé ou connu sur ce sujet après le temps de la censure. Un sujet censuré peut ou non avoir un événement après la fin du temps d’observation.
- Fonction de survie S
Cet exemple utilise l’ensemble de données de survie de la leucémie myéloïde aiguë «aml» du package «survival» de R. L’ensemble de données est de Miller (1997)[1] et la question est de savoir si le cours standard de chimiothérapie doit être prolongé («maintenu») pour des cycles supplémentaires.
L’ensemble de données aml trié par temps de survie est affiché dans la boîte.
- Le temps est indiqué par la variable «temps», qui est le temps de survie ou de censure
- L’événement (récidive du cancer de l’aml) est indiqué par la variable «statut». 0 = aucun événement (censuré), 1 = événement (récurrence)
- Groupe de traitement: la variable «x» indique si une chimiothérapie d’entretien a été administrée
La dernière observation (11), à 161 semaines, est censurée. La censure indique que le patient n’a pas eu d’événement (pas de récidive de cancer aml). Un autre sujet, l’observation 3, a été censuré à 13 semaines (indiqué par statut = 0). Ce sujet était dans l’étude pendant seulement 13 semaines, et le cancer de l’aml n’a pas récidivé pendant ces 13 semaines. Il est possible que ce patient ait été recruté vers la fin de l’étude, de sorte qu’il n’a pu être observé que pendant 13 semaines. Il est également possible que le patient ait été inscrit au début de l’étude, mais ait été perdu de vue ou se soit retiré de l’étude. Le tableau montre que d’autres sujets ont été censurés à 16, 28 et 45 semaines (observations 17, 6 et 9 avec état = 0). Les sujets restants ont tous connu des événements (récidive du cancer de l’aml) pendant l’étude. La question intéressante est de savoir si la récidive survient plus tard chez les patients maintenus que chez les patients non maintenus.
Graphique de Kaplan-Meier pour les données AML[[[[Éditer]
La fonction de survie S
- L’axe des x est le temps, de zéro (lorsque l’observation a commencé) au dernier point dans le temps observé.
- L’axe des y est la proportion de sujets survivants. Au temps zéro, 100% des sujets sont vivants sans événement.
- La ligne continue (semblable à un escalier) montre la progression des occurrences d’événements.
- Une chute verticale indique un événement. Dans le tableau AML présenté ci-dessus, deux sujets ont eu des événements à cinq semaines, deux ont eu des événements à huit semaines, un a eu un événement à neuf semaines, et ainsi de suite. Ces événements à cinq semaines, huit semaines et ainsi de suite sont indiqués par les chutes verticales dans le graphique KM à ces moments.
- À l’extrême droite du graphique KM, il y a une coche à 161 semaines. La coche verticale indique qu’un patient a été censuré à ce moment. Dans le tableau de données aml, cinq sujets ont été censurés, à 13, 16, 28, 45 et 161 semaines. Il y a cinq graduations dans le graphique KM, correspondant à ces observations censurées.
Table de mortalité pour les données AML[[[[Éditer]
Une table de survie résume les données de survie en termes du nombre d’événements et de la proportion de survivants à chaque moment de l’événement. La table de vie des données aml, créée à l’aide du R logiciel, s’affiche.
La table de mortalité résume les événements et la proportion de survivants à chaque moment de l’événement. Les colonnes de la table de mortalité ont l’interprétation suivante:
- time donne les moments auxquels les événements se produisent.
- n. le risque est le nombre de sujets à risque immédiatement avant le moment, t. Être «à risque» signifie que le sujet n’a pas eu d’événement avant le temps t, et n’est pas censuré avant ou au temps t.
- n.event est le nombre de sujets qui ont des événements au temps t.
- la survie est la proportion de survivants, déterminée à l’aide de l’estimation de limite de produit de Kaplan-Meier.
- std.err est l’erreur standard de la survie estimée. L’erreur standard de l’estimation de la limite de produit de Kaplan-Meier est calculée à l’aide de la formule de Greenwood et dépend du nombre à risque (n. Risque dans le tableau), du nombre de décès (n. Événement dans le tableau) et de la proportion survivre (survie dans le tableau).
- IC inférieur à 95% et IC supérieur à 95% sont les limites de confiance inférieure et supérieure à 95% pour la proportion de survivants.
Test du log-rank: test des différences de survie dans les données AML[[[[Éditer]
Le test du log-rank compare les temps de survie de deux groupes ou plus. Cet exemple utilise un test de log-rank pour une différence de survie entre les groupes de traitement maintenus et non maintenus dans les données aml. Le graphique montre des tracés KM pour les données aml ventilées par groupe de traitement, ce qui est indiqué par la variable «x» dans les données.
L’hypothèse nulle pour un test de log-rank est que les groupes ont la même survie. Le nombre attendu de sujets survivants à chaque instant de chacun est ajusté en fonction du nombre de sujets à risque dans les groupes à chaque événement. Le test du log-rank détermine si le nombre d’événements observés dans chaque groupe est significativement différent du nombre attendu. Le test formel est basé sur une statistique du chi carré. Lorsque la statistique du log-rank est grande, cela prouve une différence dans les temps de survie entre les groupes. La statistique du log-rank a approximativement une distribution chi carré avec un degré de liberté, et la valeur p est calculée à l’aide de la distribution chi carré.
Pour les données d’exemple, le test du log-rank pour la différence de survie donne une valeur p de p = 0,0653, indiquant que les groupes de traitement ne diffèrent pas significativement en survie, en supposant un niveau alpha de 0,05. La taille de l’échantillon de 23 sujets est modeste, il y a donc peu de pouvoir pour détecter les différences entre les groupes de traitement. Le test du chi carré est basé sur une approximation asymptotique, de sorte que la valeur p doit être considérée avec prudence pour les échantillons de petite taille.
Analyse de régression des risques proportionnels (PH) de Cox[[[[Éditer]
Les courbes de Kaplan-Meier et les tests de log-rank sont plus utiles lorsque la variable prédictive est catégorique (par exemple, médicament vs placebo) ou prend un petit nombre de valeurs (par exemple, doses de médicament de 0, 20, 50 et 100 mg / jour ) qui peut être traité comme catégorique. Le test du log-rank et les courbes KM ne fonctionnent pas facilement avec des prédicteurs quantitatifs tels que l’expression génique, la numération globulaire blanche ou l’âge. Pour les variables prédictives quantitatives, une autre méthode est l’analyse de régression des risques proportionnels de Cox. Les modèles Cox PH fonctionnent également avec des variables prédictives catégorielles, qui sont codées sous forme d’indicateur {0,1} ou de variables factices. Le test de log-rank est un cas particulier d’une analyse Cox PH, et peut être effectué à l’aide du logiciel Cox PH.
Exemple: analyse de régression des risques proportionnels de Cox pour le mélanome[[[[Éditer]
Cet exemple utilise l’ensemble de données sur le mélanome du chapitre 12 de Dalgaard.
[2]Les données sont dans le package R ISwR. La régression des risques proportionnels de Cox utilisant R donne les résultats indiqués dans l’encadré.
Les résultats de la régression de Cox sont interprétés comme suit.
- Le sexe est codé sous forme de vecteur numérique (1: femme, 2: homme). Le R Le résumé du modèle de Cox donne le rapport de risque (HR) pour le deuxième groupe par rapport au premier groupe, c’est-à-dire les hommes par rapport aux femmes.
- coef = 0,662 est le logarithme estimé du rapport de risque pour les hommes par rapport aux femmes.
- exp (coef) = 1,94 = exp (0,662) – Le log du hazard ratio (coef = 0,662) est transformé en hazard ratio en utilisant exp (coef). Le résumé du modèle de Cox donne le rapport de risque du deuxième groupe par rapport au premier groupe, c’est-à-dire les hommes par rapport aux femmes. Le rapport de risque estimé de 1,94 indique que les hommes ont un risque plus élevé de décès (taux de survie inférieurs) que les femmes, dans ces données.
- se (coef) = 0,265 est l’erreur standard du log hazard ratio.
- z = 2,5 = coef / se (coef) = 0,662 / 0,265. La division du coef par son erreur standard donne le score z.
- p = 0,013. La p-valeur correspondant à z = 2,5 pour le sexe est p = 0,013, indiquant qu’il existe une différence significative de survie en fonction du sexe.
La sortie récapitulative donne également des intervalles de confiance supérieurs et inférieurs à 95% pour le rapport de risque: borne inférieure à 95% = 1,15; limite supérieure de 95% = 3,26.
Enfin, la sortie donne des valeurs p pour trois tests alternatifs pour la signification globale du modèle:
- Test du rapport de vraisemblance = 6,15 sur 1 df, p = 0,0131
- Test de Wald = 6,24 sur 1 df, p = 0,0125
- Test de score (log-rank) = 6,47 sur 1 df, p = 0,0110
Ces trois tests sont asymptotiquement équivalents. Pour un N suffisamment grand, ils donneront des résultats similaires. Pour les petits N, ils peuvent différer quelque peu. La dernière ligne, « Test de score (logrank) » est le résultat du test de log-rank, avec p = 0,011, le même résultat que le test de log-rank, car le test de log-rank est un cas particulier d’un Cox PH régression. Le test du rapport de vraisemblance a un meilleur comportement pour les échantillons de petite taille, il est donc généralement préférable.
Modèle de Cox utilisant une covariable dans les données sur le mélanome[[[[Éditer]
Le modèle de Cox étend le test du log-rank en permettant l’inclusion de covariables supplémentaires. Cet exemple utilise l’ensemble de données sur le mélanome où les variables prédictives incluent une covariable continue, l’épaisseur de la tumeur (nom de la variable = « épaisse »).
Dans les histogrammes, les valeurs d’épaisseur ne semblent pas normalement distribuées. Les modèles de régression, y compris le modèle de Cox, donnent généralement des résultats plus fiables avec des variables normalement distribuées. Pour cet exemple, utilisez une transformation de journal. Le journal de l’épaisseur de la tumeur semble être distribué plus normalement, de sorte que les modèles de Cox utiliseront l’épaisseur du journal. L’analyse Cox PH donne les résultats dans la boîte.
La valeur p pour les trois tests globaux (vraisemblance, Wald et score) est significative, ce qui indique que le modèle est significatif. La valeur p pour le log (épais) est de 6,9e-07, avec un rapport de risque HR = exp (coef) = 2,18, indiquant une forte relation entre l’épaisseur de la tumeur et un risque accru de décès.
En revanche, la valeur p pour le sexe est maintenant p = 0,088. Le hazard ratio HR = exp (coef) = 1,58, avec un intervalle de confiance à 95% de 0,934 à 2,68. Parce que l’intervalle de confiance pour HR comprend 1, ces résultats indiquent que le sexe contribue moins à la différence de HR après contrôle de l’épaisseur de la tumeur, et tend uniquement vers la signification. L’examen des graphiques de log (épaisseur) par sexe et un test t de log (épaisseur) par sexe indiquent tous deux qu’il existe une différence significative entre les hommes et les femmes dans l’épaisseur de la tumeur lorsqu’ils voient le clinicien pour la première fois.
Le modèle de Cox suppose que les dangers sont proportionnels. L’hypothèse de risque proportionnel peut être testée en utilisant le R fonction cox.zph (). Une valeur de p inférieure à 0,05 indique que les risques ne sont pas proportionnels. Pour les données sur le mélanome, p = 0,222, indiquant que les risques sont, au moins approximativement, proportionnels. Des tests et graphiques supplémentaires pour examiner un modèle de Cox sont décrits dans les manuels cités.
Extensions aux modèles Cox[[[[Éditer]
Les modèles de Cox peuvent être étendus pour traiter les variations de l’analyse simple.
- Stratification. Les sujets peuvent être divisés en strates, où les sujets d’une strate devraient être relativement plus similaires les uns aux autres qu’aux sujets choisis au hasard dans d’autres strates. Les paramètres de régression sont supposés être les mêmes dans toutes les strates, mais un risque de référence différent peut exister pour chaque strate. La stratification est utile pour les analyses utilisant des sujets appariés, pour traiter des sous-ensembles de patients, tels que différentes cliniques, et pour traiter les violations de l’hypothèse de risque proportionnel.
- Covariables variant dans le temps. Certaines variables, telles que le sexe et le groupe de traitement, restent généralement les mêmes dans un essai clinique. D’autres variables cliniques, telles que les taux de protéines sériques ou la dose de médicaments concomitants, peuvent changer au cours d’une étude. Les modèles de Cox peuvent être étendus pour ces covariables variant dans le temps.
Modèles de survie arborescents[[[[Éditer]
Le modèle de régression de Cox PH est un modèle linéaire. Elle est similaire à la régression linéaire et à la régression logistique. Plus précisément, ces méthodes supposent qu’une seule ligne, courbe, plan ou surface suffit pour séparer les groupes (vivants, morts) ou pour estimer une réponse quantitative (temps de survie).
Dans certains cas, des partitions alternatives donnent une classification plus précise ou des estimations quantitatives. Un ensemble de méthodes alternatives sont les modèles de survie structurés par des arbres, y compris les forêts aléatoires de survie. Les modèles de survie structurés en arbre peuvent donner des prédictions plus précises que les modèles de Cox. L’examen des deux types de modèles pour un ensemble de données donné est une stratégie raisonnable.
Exemple d’analyse d’arbre de survie[[[[Éditer]
Cet exemple d’analyse d’arbre de survie utilise le R paquet « rpart ». L’exemple est basé sur 146 étape C patients atteints d’un cancer de la prostate dans l’ensemble de données stagec in rpart. Rpart et l’exemple stagec sont décrits dans le document PDF « Une introduction au partitionnement récursif à l’aide des routines RPART ». Terry M. Therneau, Elizabeth J. Atkinson, Fondation Mayo. 3 septembre 1997.
Les variables par étapes sont:
- pgtime temps de progression, ou dernier suivi sans progression
- état de pgstat au dernier suivi (1 = progressé, 0 = censuré)
- âge âge au diagnostic
- eet thérapie endocrinienne précoce (1 = non, 0 = oui)
- ploïdie diploïde / tétraploïde / modèle d’ADN aneuploïde
- g2% de cellules en phase G2
- grade tumoral (1-4)
- gleason Gleason grade (3-10)
L’arbre de survie produit par l’analyse est présenté sur la figure.
Chaque branche de l’arborescence indique une répartition sur la valeur d’une variable. Par exemple, la racine de l’arbre divise les sujets avec une note <2,5 par rapport aux sujets avec une note de 2,5 ou plus. Les nœuds terminaux indiquent le nombre de sujets dans le nœud, le nombre de sujets qui ont des événements et le taux d'événements relatif par rapport à la racine. Dans le nœud à l'extrême gauche, les valeurs 1/33 indiquent que l'un des 33 sujets du nœud a eu un événement et que le taux d'événements relatif est de 0,122. Dans le nœud tout en bas à droite, les valeurs 11/15 indiquent que 11 des 15 sujets du nœud ont eu un événement et que le taux d'événements relatif est de 2,7.
Forêts aléatoires de survie[[[[Éditer]
Une alternative à la construction d’un seul arbre de survie est de construire de nombreux arbres de survie, où chaque arbre est construit à l’aide d’un échantillon des données, et de faire la moyenne des arbres pour prédire la survie. C’est la méthode sous-jacente aux modèles forestiers aléatoires de survie. L’analyse aléatoire des forêts de survie est disponible dans le R package « randomForestSRC ».
Le package randomForestSRC comprend un exemple d’analyse de forêt aléatoire de survie utilisant l’ensemble de données pbc. Ces données proviennent de l’essai de la Mayo Clinic sur la cirrhose biliaire primaire (CBP) du foie menée entre 1974 et 1984. Dans l’exemple, le modèle de survie aléatoire des forêts donne des prédictions de survie plus précises que le modèle Cox PH. Les erreurs de prédiction sont estimées par rééchantillonnage bootstrap.
Formulation générale[[[[Éditer]
Fonction de survie[[[[Éditer]
L’objet de l’intérêt principal est la fonction de survie, notée conventionnellement S, qui est défini comme
- s’il existe une possibilité de mort immédiate ou d’échec.
La fonction de survie doit être non croissante: S(u) ≤ S(t) si u ≥ t. Cette propriété suit directement car T>u implique T>t. Cela reflète l’idée que la survie à un âge plus avancé n’est possible que si tous les âges les plus jeunes sont atteints. Compte tenu de cette propriété, la fonction de distribution de durée de vie et la densité d’événements (F et F ci-dessous) sont bien définis.
On suppose généralement que la fonction de survie s’approche de zéro à mesure que l’âge augmente sans limite (c.-à-d. S(t) → 0 comme t → ∞), bien que la limite puisse être supérieure à zéro si la vie éternelle est possible. Par exemple, nous pourrions appliquer l’analyse de survie à un mélange d’isotopes de carbone stables et instables; les isotopes instables se désintégreraient tôt ou tard, mais les isotopes stables dureraient indéfiniment.
Fonction de distribution à vie et densité d’événements[[[[Éditer]
Les grandeurs associées sont définies en termes de fonction de survie.
le fonction de distribution à vie, notée conventionnellement F, est défini comme le complément de la fonction de survie,
Source de l’article