Analyse séquentielle basée sur la ML pour aider à la sélection entre VMP et RD dans le cas d’un myélome multiple nouvellement diagnostiqué

Les régimes VMP et RD utilisent différentes classes de médicaments thérapeutiques – inhibiteurs du protéasome ou immunomodulateurs. Il n’y a pas eu d’essai clinique comparant les deux schémas en tête-à-tête contre le MNM non éligible à une transplantation. Au lieu de cela, on ne trouve dans la littérature qu’une analyse rétrospective comparant les deux, qui fait état d’une SSP plus longue pour le traitement RD mais d’un risque de décès significativement réduit pour le traitement VMP chez les NDMM plus âgés21. La RD a été associée à une SSP plus longue dans la cohorte de cette étude, tandis qu’une différence non concluante a été observée au niveau de la SG (figures supplémentaires 6 et 7).
Actuellement, les évaluations pronostiques disponibles pour les patients atteints de NDMM au moment du diagnostic, telles que l’ISS révisé (R-ISS), l’International Myeloma Working Group (IMWG) et le nomogramme pronostique, peuvent être utiles pour identifier les patients nécessitant une thérapie plus agressive ou un suivi intensif. Ces évaluations pronostiques sont toutefois dynamiques et peuvent évoluer en fonction de la réponse au traitement ; elles fournissent des informations insuffisantes pour la sélection d’un traitement initial adapté au risque pour chaque patient. C’est pourquoi il existe un consensus de plus en plus large sur la nécessité d’incorporer la réponse prédictive au traitement de première ligne22,23,24,25,26,27. Les profils d’expression génétique semblent être une solution plausible, mais leur utilisation est actuellement limitée aux essais cliniques dans les centres tertiaires (universitaires). À cet égard, les modèles fondés sur les données du monde réel (RWE) font l’objet d’une attention accrue en tant qu’alternative aux essais cliniques randomisés conventionnels28,29.
Dans cette étude, nous avons développé des modèles de survie et de réponse ML pour aider à la sélection du traitement entre VMP et RD pour les patients atteints de NDMM non éligibles à l’ASCT (Fig. 5). Un total de 8 covariables – ISS, diabète, LDH, kappa sérique, créatinine, niveau de protéine M urinaire, t(4;14) et t(11;14) – disponibles au moment du diagnostic ont été nécessaires pour calculer les perspectives individualisées de survie spécifiques à l’administration d’un régime VMP ou RD en tant que traitement de première intention. Les perspectives de survie peuvent être utilisées pour éviter les régimes susceptibles d’entraîner un décès précoce, tandis que les perspectives de réponse peuvent aider à sélectionner un régime susceptible d’obtenir une meilleure réponse et une SSP plus longue. L’analyse de survie a suggéré que le choix du traitement basé sur les modèles de survie ML pourrait aider à obtenir une meilleure OS dans 17% (85/514) de la cohorte au sein du groupe II (VMPLRRDHR) et III (VMPHRRDLR). En outre, 39 % dans le groupe I (VMPLRRDLR) et IV (VMPHRRDHR) auraient pu obtenir une réponse optimale précoce et une SSP supérieure en sélectionnant le régime basé sur les modèles de réponse ML nécessitant un total de 10 covariables – stade SSV, type de myélome, âge, del(13q), t(11;14), diabète, taux d’albumine, taux de créatinine, taux de protéines urinaires et NAN. Le nombre combiné de patients qui auraient pu bénéficier des modèles ML est de 202 (39 %), ce qui nous semble suffisamment important pour servir de base à une étude prospective.

Schéma de la méthodologie proposée pour aider à la sélection du traitement pour les MNDM non éligibles à une transplantation, sur la base de l’application des modèles de survie et de réponse ML.
Dans notre cohorte, l’EOR a bénéficié d’un taux de RC significativement supérieur et d’une SSP plus longue par rapport au schéma VMP ou RD. Une différence non significative a été observée en ce qui concerne la SG, ce qui était quelque peu attendu puisque le choix des traitements et des réponses ultérieurs peut également avoir un impact sur la survie. La variable la plus importante pour prédire la réponse optimale précoce au régime VMP était le type de myélome (maladie des chaînes légères, IgG, IgA ou autre). Le MM de type IgG, en particulier, était le prédicteur négatif le plus puissant : Seuls 9 % des patients de type IgG ont obtenu une réponse optimale précoce au traitement VMP. Alors que la del(13q) seule n’était pas l’une des 10 principales caractéristiques différentes entre les deux types de répondeurs (Fig. 5 supplémentaire), l’AC a entraîné la plus grande amélioration de la ROC-AUC du modèle de réponse ML lorsqu’elle a été utilisée en plus du type de myélome. Il en va de même pour la t(11;14) et le diabète, qui ont permis d’améliorer la performance prédictive lorsqu’ils ont été combinés aux covariables susmentionnées. La del(13q) a été impliquée dans la régulation du cycle cellulaire et de l’apoptose. Le taux de del(13q) est connu pour être le plus élevé (50 %) dans la leucémie lymphoblastique chronique (LLC) et est associé à un meilleur pronostic30. Une étude précédente basée sur 1181 patients atteints de NDMM a rapporté que la del(13q) était significativement associée à une OS plus longue mais pas à la PFS, même après ajustement pour la présence de t(11;14) et t(6;14)31. Ces patients ont reçu plusieurs types de traitements différents en première intention, parmi lesquels la RD, administrée à moins de la moitié de la cohorte, était le seul régime identique à celui de la présente étude. À cet égard, le rôle ultime de la del(13q) et l’influence de la taille, de la charge et du type de délétion en association avec la mutation du gène du rétinoblastome (RB1) doivent être révélés dans de futures études. Les autres covariables, telles que le taux de créatinine et la CNA, ont été associées à la réponse et/ou au pronostic des patients atteints de NDMM32,33Il n’est donc pas surprenant que les modèles ML proposés utilisent ces covariables ainsi que les variables susmentionnées.
Nous nous sommes concentrés sur le développement de modèles ML qui utilisent un sous-ensemble minimal de covariables pour calculer une prédiction. Les méthodes de ML sont puissantes dans l’établissement et/ou l’identification de relations structurées entre les caractéristiques pour classer ou quantifier le(s) résultat(s). La ROC-AUC tend à augmenter à mesure que les caractéristiques disponibles pour prédire un résultat sont plus nombreuses, en supposant que chaque covariable n’est pas fortement corrélée à une autre. Par conséquent, il est courant d’utiliser l’ensemble des caractéristiques, c’est-à-dire les caractéristiques cliniques et/ou les données multi-omiques, dans la formation des modèles ML pour prédire la réponse au médicament ou la survie. Toutefois, une telle utilisation excessive de caractéristiques rend les modèles difficiles à expliquer. La difficulté et le coût de la mesure et de l’enregistrement précis de toutes les données augmentent avec le nombre de caractéristiques. Le risque de surajustement des données augmente également, ce qui rend les modèles moins précis lorsqu’il s’agit de prédire les résultats pour de nouveaux cas34,35. En l’absence d’étalon-or, le nombre et la composition des caractéristiques utilisées dans les modèles ML sont souvent justifiés par la performance prédictive et la taille des données. Parmi les deux sous-ensembles de la cohorte de développement, les patients NDMM traités avec le régime VMP (N= 398) sont les plus importants rapportés à ce jour à notre connaissance et rendent les modèles ML respectifs plus crédibles. La validation externe et indépendante utilisant la cohorte de test a abouti à un niveau de performance similaire.
L’approche et les modèles ML proposés présentent quelques limites. Tout d’abord, les modèles ML ont été entraînés avec la cohorte diagnostiquée et traitée en Corée du Sud. L’homogénéité ethnique (asiatique) de la cohorte peut limiter l’applicabilité, bien que les covariables utilisées pour former les modèles soient universellement mesurées lors du diagnostic. Le modèle ML développé serait plus puissant si l’on y ajoutait un ou plusieurs sous-modèles ciblant d’autres paramètres significatifs, notamment les événements indésirables, les coûts médicaux ou l’indice de satisfaction subjective, mais une telle analyse a été limitée en raison de la conception rétrospective. Le choix entre le régime VMP et le régime RD pour les NDMM non admissibles à une transplantation n’est pas non plus applicable à l’échelle mondiale, car de nouvelles combinaisons, telles que DaraVMP, VRD ou DaraRD, ont été largement acceptées dans le monde entier en tant que traitement de première intention36. Cependant, un résumé récent de l’étude italienne de phase IV (NCT03829371)37 a montré que la décision médicale nuancée entre VMP et RD peut encore être pertinente. Par exemple, alors que dans l’essai clinique, la SG à 2 ans était de 89 % avec la VMP, notre modèle ML a prédit la même SG pour les patients stratifiés en VMPLR. De même, alors que l’essai randomisé prévoyait une SG à 2 ans de 75 % pour les patients sous RD, notre modèle de survie ML prévoyait une SG à 2 ans de 70 % pour les RDHR. Ces observations suggèrent que nos résultats peuvent être facilement extrapolés, indépendamment des disparités raciales.
Bien que notre modèle puisse être plus utile pour les patients NDMM fragiles qui ne sont pas adaptés au nouveau régime triplet ou quadruplet, nous n’avons pas pu étudier l’impact de la fragilité car elle n’était pas disponible dans les ensembles de données. Nous pensons donc que l’approche proposée, qui utilise les modèles ML pour obtenir des informations individualisées sur les perspectives de survie et de réponse, a plus de valeur que les modèles eux-mêmes. Une autre limite est liée à la toxicité des médicaments et à la qualité de vie, qui peuvent dicter le choix du régime, mais qui ne sont pas explicitement prises en compte par les modèles ML. Malgré ces limites, nous pensons que l’approche proposée et les modèles ML peuvent aider à la sélection du traitement pour les NDMM non éligibles à une transplantation. Les modèles fournissent des perspectives sur la SG et la réponse qui sont spécifiques au traitement et au patient, ce qui permet une stratification plus fine du risque. Les modèles ML peuvent être formés et fonctionner en temps réel en utilisant les données RWE et les caractéristiques cliniques mesurées au moment du diagnostic, ce qui nécessite des ressources minimales pour l’adoption dans la pratique clinique. Nous pensons que notre méthodologie peut contribuer à l’identification d’un traitement de première ligne optimal et à l’amélioration de la survie des patients NDMM non éligibles à l’ASCT.