INFORMER: Mesures organisationnelles basées sur l’infrarouge de la tumeur et de son microenvironnement pour prédire la survie des patients
Abstrait
La structure et l’organisation d’une tumeur et son microenvironnement sont souvent associées aux issues du cancer en raison de la composition moléculaire et de la signalisation spatialement variables. Un défi persistant consiste à utiliser cette organisation spatiale physique et chimique pour comprendre la progression du cancer. Ici, nous présentons un cadre de mesure organisationnel (INFORM) basé sur l’imagerie infrarouge haute définition qui exploite le contraste chimique intrinsèque du tissu pour marquer les composants uniques de la tumeur et de son microenvironnement. En utilisant des méthodes de calcul objectives et automatisées, nous déterminons en outre les caractéristiques d’organisation importantes pour la prédiction. Nous montrons que l’organisation spatiale de la tumeur évaluée avec ce cadre est prédictive de la survie globale dans le cancer du côlon qui ajoute à la capacité des variables cliniques telles que le stade et le grade, doublant approximativement le risque de décès chez les individus à haut risque. Nos résultats ouvrent une voie entièrement numérique pour mesurer et étudier l’association entre l’organisation spatiale tumorale et la progression de la maladie.
INTRODUCTION
Une lacune critique dans la prédiction du comportement de la tumeur réside dans la détermination de la manière dont la structure et l’organisation de la tumeur (allant de bien organisée à désorganisée) affectent sa capacité à interagir avec le microenvironnement environnant. Accès aux cellules inflammatoires qui peuvent fournir des signaux protumorigènes (1), l’accès aux nutriments (ou leur manque, ce qui peut amener les tumeurs à changer de voie métabolique) (2, 3), changements de pH (4), et l’interaction des cellules tumorales avec des types spécifiques de collagène qui peuvent être associés à des tumeurs acquérant un phénotype mésenchymateux plus agressif (5) sont quelques-unes des variables qui influencent la progression de la tumeur. Plusieurs de ces interactions dépendent de la forme et de la structure de la tumeur (appelée organisation spatiale du microenvironnement tumoral et tumoral) qui influencent la capacité des cellules tumorales individuelles à interagir avec le microenvironnement tumoral. Cette modulation spatiale peut affecter la disponibilité des facteurs de signalisation, des nutriments et de l’oxygène dans le microenvironnement tumoral (6). Il peut également influencer la vitesse de transmission des signaux prométastatiques entre les cellules tumorales et le microenvironnement tumoral et déterminer par la suite la vitesse à laquelle les tumeurs progressent. La principale limitation dans la compréhension de cette modulation spatiale est le manque de méthodes pour estimer avec précision la structure et l’organisation de la tumeur. Il existe un besoin d’identification de haute précision de la tumeur et de plusieurs de ses composants de micro-environnement dans les images de tissu pour chaque pixel pour rendre cette estimation réalisable.
Les identifications des composants tissulaires au niveau du pixel par les pathologistes demandent beaucoup de travail et de temps. De telles identifications ne sont pas réalisables pour plusieurs centaines d’images de tissus nécessaires pour mesurer de manière robuste la structure spatiale et l’organisation de la tumeur. L’un des plus grands ensembles de données d’images annotées provient du défi des métastases cancéreuses dans les ganglions lymphatiques (CAMELYON), où 400 images ont été annotées par des pathologistes identifiant uniquement les zones normales et les tumeurs métastatiques dans les images des ganglions lymphatiques (sept). Le microenvironnement tumoral est beaucoup plus complexe, changeant dynamiquement avec le développement de la tumeur. L’estimation de la structure et de l’organisation de la tumeur par rapport à ce microenvironnement nécessiterait l’identification de chaque composant histologique unique (HC) dans l’image tissulaire (10 ou plus dans le tissu du côlon), car il est difficile de déterminer a priori quels composants spécifiques du microenvironnement tumoral jouent un pronostic. rôle. Il est particulièrement important de faire la différence entre le stroma normal, le stroma réactif (RS) et le stroma infiltré par les cellules immunitaires, qui ont été précédemment impliqués comme ayant un rôle pronostique (8). L’annotation manuelle de ces nombreux composants sur plusieurs centaines d’images de tissus est impossible et souffrirait également de la variabilité interobservateur (9, dix).
Les classificateurs basés sur l’apprentissage automatique peuvent grandement aider à des annotations précises au niveau des pixels des images de tissus, qui peuvent ensuite être utilisées pour estimer l’organisation spatiale de la tumeur, mais n’ont pas été développées avec succès jusqu’à présent. Il existe une multitude de signaux biochimiques dans les tissus, mais les efforts pour segmenter les tissus ont été limités à quelques composants. Cette limitation est due aux limites de contraste des méthodes traditionnellement utilisées telles que l’hématoxyline et l’éosine (H&E), qui servent d’entrées aux modèles d’apprentissage automatique. Les méthodes traditionnellement utilisées pour l’évaluation des tissus ne combinent pas les mesures biochimiques détaillées avec la localisation spatiale. Images de diapositives colorées H & E (11) sont de mauvais candidats pour les classificateurs d’apprentissage automatique lorsque plus de quelques composants doivent être identifiés. Les images H&E fournissent un contraste tissulaire limité et sont affectées par des variations expérimentales et d’imagerie qui dégradent davantage les performances des classificateurs d’apprentissage automatique (12). De plus, de telles taches peuvent ne pas capturer des changements chimiques subtils qui ne se sont pas encore manifestés dans des caractéristiques structurelles grossières. L’immunocoloration peut augmenter le contraste dans les tissus en ciblant des composants tissulaires spécifiques, mais elle est limitée à quelques marqueurs par lame et n’est pas pratique en raison de la nécessité d’un traitement intensif des échantillons. Les flux de travail complexes présentent également un obstacle à l’adoption et sont une opportunité d’erreur. L’imagerie par spectrométrie de masse permet des mesures d’imagerie multiplexées du protéome et du métabolome et s’est avérée utile dans la détection et la classification des cancers (13–16) et pour les mesures pronostiques (17–19). Alors que les méthodes d’imagerie par spectrométrie de masse fournissent un aperçu détaillé des biomolécules dans le tissu, elles sont généralement limitées dans la résolution spatiale qui peut être obtenue (20), interdisant leur utilisation pour étudier la structure tumorale. Un test idéal devrait plutôt équilibrer la lecture du contenu multiplexé avec des détails d’imagerie élevés sans avoir besoin de plusieurs étapes de traitement. Il doit également capturer les caractéristiques essentielles de la structure et de l’organisation des tissus d’une manière suffisamment simple et robuste pour être systématiquement adoptée.
L’imagerie spectroscopique infrarouge à transformée de Fourier haute définition (HD-FTIR) est une technique qui cherche à mesurer à la fois le contenu spatial et chimique des échantillons sans avoir besoin de coloration (21–23). Plus précisément, la spectroscopie infrarouge (IR) permet la mesure des classes d’abondance de molécules, y compris les lipides, les protéines, les acides nucléiques et les glucides. Cette abondance est lue comme l’absorbance des espèces moléculaires absorbant les IR telles que les groupes aliphatiques, les amides, les phosphates et l’ester carbonyle à des fréquences de vibration spécifiques dépendant de leur composition, de la structure des macromolécules et de l’environnement local. Le spectre agit comme un code à barres de tissus normaux ou malades. Des travaux antérieurs ont montré que les tissus subissent des changements biochimiques critiques lorsqu’ils passent d’un état normal à un état cancéreux. Par exemple, des changements dans la composition lipidique (24), glycosylation des protéines (25) et la distribution des glucides (26) dans le développement du cancer ont été documentés. HD-FTIR combine la capacité de microscopie optique de fournir des détails spatiaux avec des mesures spectroscopiques du contenu moléculaire inhérent à chaque pixel. Le contenu moléculaire in situ est mesuré comme l’augmentation de l’absorbance des fréquences de résonance correspondant aux structures caractéristiques des molécules dans la gamme IR. Avec les progrès récents de l’imagerie HD-FTIR, la tumeur et le microenvironnement peuvent être mesurés avec des tailles de pixels subcellulaires d’environ 1 μm (21), ce qui réduit la taille des pixels de près de six fois par rapport aux instruments d’imagerie IR conventionnels (27). Cette définition améliorée localise mieux le signal spectral et fournit une image de meilleure qualité, permettant un marquage précis des composants de la tumeur et du microenvironnement sur l’image tissulaire et améliorant les performances des algorithmes de calcul en aval. Les données spatio-spectrales collectées de cette manière se prêtent très bien aux algorithmes d’apprentissage automatique (27, 28). La composition chimique unique des différentes classes histologiques dans le tissu donne le contraste nécessaire pour que les algorithmes de classification basés sur l’apprentissage automatique fonctionnent avec une grande précision. La haute définition des images obtenue avec cette technique aide en outre à obtenir des estimations précises de la structure et de l’organisation des tissus.
Dans ce travail, nous nous concentrons sur la contrainte spatiale qui est mesurée par la forme et la structure de la tumeur, qui peut, à son tour, affecter la façon dont les cellules tumorales individuelles sont capables d’interagir avec le microenvironnement tumoral et les changements spécifiques dans le stroma tumoral (réactif et stroma non réactif et présence de cellules inflammatoires). Nous avons postulé qu’avec l’imagerie spectroscopique HD-FTIR couplée à l’apprentissage automatique, nous pouvons identifier avec précision et précision les composants du microenvironnement tumoral et tumoral dans les images tissulaires. En nous appuyant sur cette reconnaissance au niveau du pixel, nous démontrons que l’organisation spatiale de la tumeur et de son microenvironnement est prédictive de l’issue chez les patients atteints de cancer (Fig. 1).
RÉSULTATS
Segmentation basée sur l’imagerie HD-IR du tissu du côlon en 10 CH uniques
Dans ce travail, nous avons imaginé huit microréseaux de tissus du côlon (TMA) avec imagerie spectroscopique HD-FTIR. Cette cohorte était composée de 604 échantillons provenant de 320 patients présentant les caractéristiques décrites dans le tableau 1. Notre premier objectif était d’utiliser le contraste spectral dans le tissu pour segmenter le tissu du côlon en 10 HC majeurs. Ces HC étaient l’épithélium (mature), la mucine, l’épithélium (prolifératif), la nécrose, le RS, le sang, les cellules inflammatoires, le stroma non réactif, le muscle et le stroma lâche. Pour faire cette classification en 10 classes (schématisée sur la figure S1A), nous avons acquis ~ 1 milliard de spectres avec 1506 bandes IR par spectre. Un spectre IR a été acquis pour chaque pixel de 1 μm x 1 μm à partir d’échantillons d’environ 1 mm de diamètre. Nous avons obtenu des annotations de pathologistes sur des images H&E acquises en série, marquant les zones qui pourraient être identifiées comme HC avec une grande confiance. Ces annotations ont été transférées sur des images HD-IR pour développer la vérité terrain pour le classificateur. De cette manière, nous avons annoté environ 6900 régions d’intérêt sur 419 échantillons avec plus de 4,3 millions de pixels spectraux.
Les spectres moyens des 10 HC (figure 2A) indiquent les différences de constitution chimique entre ces classes. Par exemple, les différences les plus importantes ont été observées dans la région des empreintes digitales entre 982 et 1480 cm−1, avec de la mucine et un épithélium mature présentant des caractéristiques nettement distinctes de 980 à 1182 cm−1. La mucine est une protéine glycosylée qui présente une forte absorption à 1038 cm−1 (29). L’épithélium mature (cellules caliciformes) contenant de la mucine cytoplasmique enregistre également une absorbance associée aux glycoprotéines mais avec une composition protéique distincte. Comme on le voit à partir des spectres et des images d’adénocarcinomes (Fig. 2B), cette propriété fonctionnelle de l’épithélium mature est fréquemment perdue dans l’épithélium malin ou prolifératif. Cette perte fonctionnelle se traduit par une différence entre les spectres collectés à partir de l’épithélium prolifératif et de l’épithélium mature de type normal. Alors que certaines des différences spectrales illustrées sur la figure 2A surviennent en raison de différences entre les composants histologiques, nous avons également pris en compte d’autres sources de variations. Certaines de ces sources de variation étaient les variations expérimentales (basées sur la préparation du tableau), l’hétérogénéité des patients et l’hétérogénéité intra-patient (fig. S1B). Après prise en compte de ces variations, nous avons retenu 50 caractéristiques spectrales entre 1053 et 1593 cm−1 et entre 2939 et 2987 cm−1 qui ont finalement été utilisés pour le classificateur d’apprentissage automatique.
En utilisant les signatures spectrales isolées des HC du côlon, le classificateur d’apprentissage automatique HD-IR a démontré des performances de classification élevées pour segmenter les tissus du côlon. Nous avons formé et optimisé un algorithme d’apprentissage supervisé basé sur des forêts aléatoires pour segmenter 10 HC du côlon à partir de données d’imagerie spectroscopique HD-IR (fig. S1C). Ce classificateur a été formé sur quatre tableaux (a1 à a4) (fig.S2, A à D) et 126946 spectres par classe, étalonné sur deux tableaux supplémentaires (a5 et a6) (fig.S3, A et B), et testé sur deux tableaux indépendants (a7 et a8) (fig. S4, A et B). Pour la formation et les tests, l’aire sous la courbe (AUC) de la courbe des caractéristiques de fonctionnement du récepteur (ROC) a été évaluée. Une spécificité et une sensibilité élevées ont été obtenues à la fois dans les données de formation et de validation indépendante, donnant une AUC moyenne de 0,94 (fig. S5) et 0,93 (figure 2C), respectivement.
La cohorte utilisée pour la formation dans cette étude comprenait des noyaux de tissu du côlon inclus en paraffine, où les métastases de la muqueuse colorectale et des ganglions lymphatiques d’apparence normale ont également été échantillonnées. La figure 2B compare les images H&E avec les images histologiques HD-IR correspondantes pour la muqueuse colorectale normale, les tumeurs invasives et les métastases des ganglions lymphatiques. Nous avons également pu identifier et localiser la présence de cellules malignes dans des échantillons de métastases ganglionnaires. Travaux historiques antérieurs (30) avait décrit une méthode d’apprentissage en profondeur qui a été utilisée pour effectuer la classification d’image de la lame entière et la localisation de la tumeur dans les images H&E des ganglions lymphatiques avec une AUC de 0,925 et 0,705, respectivement. En comparaison, nous avons systématiquement obtenu> 0,93 AUC pour la classification de la lame entière et la localisation de la tumeur dans le ganglion lymphatique en utilisant notre algorithme de classification, indiquant une performance de classification supérieure par rapport aux références H&E précédemment rapportées, mesurées par les valeurs de l’ASC ROC. Nous avons également testé les performances de ce classificateur sur 27 autres échantillons de résection chirurgicale, qui ont montré une bonne correspondance avec les images H&E (Fig. 2D et Fig. S6).
Les mesures organisationnelles spatiales de la tumeur prédisent la survie en présence de RS
Nous nous sommes ensuite concentrés sur la caractérisation et l’utilisation de la structure et de l’organisation de la tumeur pour le pronostic. Pour réduire la complexité du microenvironnement tumoral à des quantités mesurables, nous nous sommes concentrés sur trois composants principaux du microenvironnement tumoral – RS, où la réaction desmoplastique était présente; stroma non réactif, où la réponse desmoplastique était absente; et les lymphocytes. La réaction desmoplasique a été identifiée à l’aide de critères préalablement établis, à savoir, l’enrichissement en fibroblastes «réactifs», l’organisation moléculaire du stroma et la présence d’autres types cellulaires (31, 32). Dans chaque cas, le pathologiste fournissant la catégorisation de la vérité terrain était aveugle à toutes les données clinicopathologiques d’accompagnement, y compris le stade. Pour cette analyse, nous avons sélectionné des cœurs de TMA avec au moins 5% d’épithélium malin par zone, retenant un total de 245 patients dans l’étude. Sur ces 245 patients, notre modèle a été développé et évalué sur 220 patients, et 25 patients ont été laissés de côté pour la validation de la stratification des risques.
Nous avons utilisé les images annotées pour mesurer les caractéristiques spatiales quantitatives qui estiment la structure et l’organisation de la tumeur dans le contexte du micro-environnement. Pour cette analyse, nous avons sous-échantillonné l’image à un tiers pour approximer la taille de pixel à une seule cellule tumorale et pour améliorer le temps de calcul. Nous avons défini la structure tumorale en utilisant la distance apparente entre la tumeur et une HC non tumorale (réHC). Cette fonction de distance réHC est une mesure de la distance entre les cellules tumorales et un HC non tumoral. Plus précisément, parce que nous voulons comprendre la structure de la tumeur dans le contexte de son microenvironnement, réHC varie selon la présence et la proximité du HC utilisé pour calculer réHC. Pour démontrer comment la structure est capturée avec réHC, nous avons simulé des cas où la zone tumorale était maintenue constante tout en faisant varier la forme de la tumeur de cylindrique à sphérique (Fig. 3A). Sur la base de réHC valeurs, les tumeurs cylindriques ont des réHC par rapport aux tumeurs sphériques. Bien que la structure de la tumeur soit un composant important, la structure de la tumeur ne capture pas l’abondance du HC qui influence également le comportement de la tumeur. Par conséquent, nous avons défini la densité HC du microenvironnement (NHC) comme la densité d’un HC dans un rayon R des cellules tumorales comme centre. Par conséquent, l’organisation spatiale finale de la tumeur et de son microenvironnement a été capturée comme le produit d’interaction entre réHC et NHC (jeHC) pour chaque cellule tumorale (Fig. 3B).
Pour déterminer si les caractéristiques spatiales quantitatives définies ici sont associées au résultat, nous avons comparé la survie des patients à réHC, NHC, et jeHC pour chacun des microenvironnement HC, à savoir RS, lymphocytes et stroma normal. Nous avons dichotomisé chacune de ces caractéristiques candidates en les divisant à la valeur médiane, ce qui nous donne deux groupes de patients par caractéristique et par composant de microenvironnement testé. Nous avons effectué le test du log-rank univarié pour déterminer s’il y avait une différence statistiquement significative dans la survie globale des deux groupes (tableau 2). À partir des deux tests, seules les caractéristiques mesurées avec RS comme composant de micro-environnement ont montré une différence statistiquement significative dans la survie globale. De plus, seule la fonction d’interaction (jeRS) était significative après correction pour le test d’hypothèses multiples en utilisant la correction de Bonferroni, avec P valeur <0,0005. À partir de cette analyse, nous avons donné la priorité à RS comme composante d'intérêt du micro-environnement. En outre, les courbes de survie de Kaplan-Meier pour la survie globale et la survie sans maladie ont montré des résultats significativement différents pour les patients stratifiés avec dichotomisés jeRS scores (Fig.3, C et D) avec P valeurs de 0,0003 et 0,0274 et aux puissances 0,93 et 0,40, respectivement. Bien que jeRS montre une stratification significative des patients pour déterminer la survie sans maladie en analyse univariée, notre ensemble de données n’est pas alimenté pour prédire la survie sans maladie. Compte tenu de la faible puissance de l’ensemble de données actuel pour déterminer la récurrence, il n’est pas clair si jeRS est prédictif de la survie sans maladie. Les résultats de la survie globale ont été validés sur un ensemble indépendant de patients non utilisés dans l’ensemble de découverte, qui a montré une tendance similaire dans la stratification de la survie globale (fig. S7).
Enfin, pour déterminer si les caractéristiques spatiales s’ajoutent aux marqueurs pronostiques actuellement connus tels que le stade et le grade, nous avons évalué le modèle de régression multivariée de Cox du temps jusqu’à la mort (figure 3E et tableau S1). Nous avons modélisé la survie globale sur la fonction d’interaction jeRS, en corrigeant le stade, le grade, l’âge, le sexe et la source de la tumeur. La fonction d’interaction jeRS ont montré un effet indépendant sur l’augmentation du risque de décès chez les patients P valeur de 0,011. La P les valeurs de trois tests testant l’ajustement du modèle, le test du rapport de vraisemblance, le test de Wald et le test du log-rank étaient tous inférieurs à 4 × 10−11, rejetant l’hypothèse nulle que tous les coefficients (β) sont égaux à 0. Dans l’analyse de régression multivariée de Cox, le rapport de risque, évalué comme exp. (β), variait entre 1,15 et 3,07, indiquant une forte taille d’effet. D’autres caractéristiques qui ont montré une association significative avec le risque de décès étaient le stade et l’âge, comme prévu. En revanche, le grade tumoral évalué sur un échantillon chirurgical entier par des pathologistes n’a pas montré d’association significative avec un risque accru lorsqu’il était modélisé avec d’autres covariables.
Les tumeurs agressives sont souvent détectées à des stades ultérieurs, ce qui entraîne un pire pronostic pour les patients. Nous avons testé s’il y avait une association entre l’agression tumorale, telle que mesurée par les caractéristiques spatiales définies ici avec le stade de la tumeur. En effectuant deux échantillons t test sur la fonctionnalité d’interaction continue jeRS regroupés par stade, nous avons constaté que les tumeurs de stade bas (stade 1 et stade 2) avaient des jeRS par rapport aux tumeurs de stade élevé (stade 3 et stade 4) (tableau 3). Deux échantillons t test sur la combinaison de ces groupes avait un P valeur de 0,0012 à une puissance de 0,90. La valeur moyenne de jeRS était également significativement différent entre le stade 2 et le stade 3 au niveau de signification de 0,05 (P = 0,00142 et puissance = 0,9) et entre l’étage 2 et l’étage 4 (P = 0,00243 et puissance = 0,87). Nous n’avons pas observé de différence statistiquement significative entre les cas de stade 1 et de stade 4 en raison du faible nombre de cas à chacun de ces stades. Cela a entraîné une faible puissance (0,22) pour effectuer le test statistique. Le test de Mann-Whitney, qui ne suppose pas des distributions normales et teste si les patients sont échantillonnés à partir de populations ayant des distributions identiques, a donné des résultats similaires.
Compte tenu du pouvoir prédictif de la fonction d’interaction, nous avons émis l’hypothèse que la visualisation du score de risque continu sur des échantillons de tissus peut fournir une mesure spatiale du risque qui peut être facilement corrélée par le praticien avec des images colorées conventionnelles. Cette visualisation spatiale du risque protège davantage notre méthode contre les erreurs introduites par des conditions tissulaires anormales ou des erreurs isolées. Lors de la cartographie du score de caractéristique d’interaction mesurée sur le tissu, nous observons une transition en douceur du risque dans les deux échantillons de base de TMA (Fig. 4A) et une grande résection chirurgicale (Fig. 4B). Alors que les petites zones de poinçon TMA étaient assez homogènes, nous avons observé un gradient de score de risque sur une résection chirurgicale beaucoup plus grande. Il est probable que le score de risque soit spécifiquement prédictif sur les fronts invasifs de la tumeur, puisque la plupart des poinçons TMA ont été sélectionnés à partir des zones frontales invasives de la tumeur (33). L’utilité des fronts invasifs dans l’étude du cancer est largement débattue. Nous ne comprenons pas entièrement son rôle dans la carcinogenèse et le pronostic, bien qu’il soit clair que le front invasif a une certaine pertinence biologique. Des travaux supplémentaires sur les résections chirurgicales peuvent mettre en lumière le rôle du front invasif et éventuellement développer des modèles qui peuvent corriger le biais frontal invasif dans notre travail.
DISCUSSION
Le mécanisme régissant l’invasion tumorale et son interaction avec le stroma environnant et les cellules stromales n’est pas facile à capturer. Comprendre cette contrainte spatiale est essentiel pour prédire le comportement de la tumeur. Modifications structurelles de la tumeur et de son microenvironnement au début de la métastase (34) ne peut pas être pris en compte dans les dosages moléculaires traditionnels. En outre, l’analyse quantitative des images est limitée par les informations moléculaires de la tache et des artefacts introduits lors des étapes de préparation, de coloration et d’imagerie des échantillons (35). Alors que l’architecture et la morphologie des tissus peuvent être évaluées par les pathologistes, la détermination est largement subjective (36–38). Plusieurs critères d’évaluation d’image objectifs associés aux résultats, tels que le rapport nucléaire / cytoplasmique des marqueurs moléculaires (39), proportions cellulaires (40) et mesurer l’infiltration immunitaire (41, 42), à été proposé. Ces procédures nécessitent souvent des travaux supplémentaires de pathologiste et de laboratoire et ne mesurent pas la géométrie de la tumeur.
Jusqu’à présent, une grande partie de l’attention a été accordée aux aspects moléculaires de l’interaction entre le microenvironnement tumeur et la tumeur. Il a été démontré que la signalisation chimique via les cytokines et les chimiokines, la présence de fibroblastes activés par le cancer et les modifications d’autres cellules stromales modulent le comportement des tumeurs. Outre la signalisation chimique, la restructuration de la matrice extracellulaire dans les tumeurs est liée à la transformation de la tumeur en un phénotype plus agressif. Bien que largement démontrées, de nombreuses caractéristiques liées au pronostic n’ont pas trouvé de fondement en raison du manque de critères d’évaluation objectifs. Contrairement à certains cancers où les marqueurs moléculaires ont établi un rôle dans la détermination des résultats et des options thérapeutiques (43, 44), la détermination des résultats des patients dans les cancers du côlon est moins précise. Par exemple, caractériser le stroma (31) basé sur la réponse stromale fibreuse est un indicateur des taux de survie à 5 ans. Malgré le rôle pronostique de la réponse stromale dans les cancers du côlon (45, 46), un système de notation objectif et reproductible reste sous-développé, en grande partie en raison des préoccupations découlant du manque de concordance (38).
INFORM (Mesures OR organisationnelles basées sur l’infrarouge) intègre les informations moléculaires du tissu avec son contexte spatial (47), sans traitement ni coloration approfondis des échantillons. Par conséquent, INFORM nous permet d’identifier les changements biochimiques critiques dans l’image tissulaire. Un ensemble complexe de facteurs, à plusieurs échelles, détermine une réponse tumorale qui peut être évaluée par INFORM. L’association entre le score de fonctionnalité d’interaction basé sur l’étape et INFORM (jeRS) est assez nuancé. En un mot, INFORM est capable d’identifier les changements dans les lésions précoces associés à un comportement agressif qui ne sont pas actuellement capturés dans l’approche clinique de la stadification. Notre modèle statistique qui corrigeait le stade (modèle de régression multivariée de Cox du délai de mort; Fig. 3E) montrait toujours une survie différentielle entre les patients qui ont un score de risque INFORM plus élevé et les patients qui n’en ont pas. Cela indique que le score de risque INFORM est indépendant du stade et ajoute potentiellement une valeur diagnostique. Cependant, les tumeurs agressives qui obtiennent un score de risque INFORM élevé seraient souvent diagnostiquées à des stades ultérieurs, ce qui, selon nous, peut expliquer une association entre le stade et le score de risque INFORM, mais doit être testée davantage. Néanmoins, la nouveauté de l’approche présentée ici est qu’une petite biopsie (<1 mm de diamètre) de la tumeur contient des informations très précieuses sur l'agression tumorale, présentes sous la forme d'une combinaison de données biochimiques et spatiales. En particulier dans le cas des cancers colorectaux où le diagnostic est généralement effectué à l'aide d'une biopsie prise pendant la coloscopie et suivie éventuellement de tests supplémentaires pour la stadification, cela peut s'avérer essentiel pour déterminer l'urgence de la réponse, à la fois en termes de tests supplémentaires et de thérapie. Notamment, à partir du même échantillon de biopsie, la mesure clinique actuellement la plus répandue est le grade de la tumeur, ce qui est insuffisant pour déterminer le pronostic par rapport au score de risque INFORM, en plus d'être subjective et manuelle. Enfin, INFORM fournit une mesure qui équilibre la facilité de mise en scène et la complexité des nombreuses informations dans le microenvironnement.
Une méthode facilement interprétable, mais automatisée et objective, telle que proposée ici, établit un équilibre entre la notation objective et reproductible et l’interprétabilité des résultats. Ici, nous avons non seulement pu associer des marqueurs du microenvironnement avec le résultat, mais également fournir des conseils pour comprendre à quel point les changements spatialement spécifiques dans le microenvironnement tumoral sont efficaces pour prédire les résultats pour les patients. Parmi les associations entre la réaction stromale et le résultat du patient, les liens étaient beaucoup plus prononcés dans notre modèle d’interaction. Ainsi, les informations provenant du microenvironnement tumoral peuvent ajouter de nouvelles informations à partir d’une avenue qui n’a jamais été explorée auparavant. Cette observation offre un potentiel de découverte et de modèles plus complexes pour caractériser le microenvironnement. Il est important de noter que notre méthode ne perturbe en aucune façon le tissu et peut en fait entraîner une réduction des étapes de traitement si des technologies telles que la coloration inoxydable, dans lesquelles les spectres génèrent des taches H&E par ordinateur (48), sont adoptées. Avec les tests approfondis sur plusieurs TMA et sur les résections chirurgicales des patients, la robustesse de notre approche a été établie. À notre connaissance, il s’agit de l’étude d’imagerie HD-IR la plus approfondie, fournissant des détails de microscopie optique proches avec une spécificité chimique. En outre, nous ne sommes au courant d’aucune autre étude qui a démontré une segmentation automatisée, précise et précise de 10 HC ou plus dans des tissus précis au niveau du pixel dans diverses TMA et également des résections chirurgicales. Ce travail présente l’ensemble de données d’imagerie tissulaire le plus vaste et le plus diversifié acquis pour l’imagerie chimique de tout type de tissu.
Bien que INFORM fonctionne très bien dans la stratification des patients, il existe de nombreux facteurs inexplorés qui pourraient potentiellement stratifier davantage les patients. Par exemple, les approches émergentes en imagerie spectroscopique IR augmentent la résolution spatiale ainsi que le niveau de détail moléculaire et sa fidélité qui peuvent être enregistrés. Des différences moléculaires plus fines dans le RS et l’hétérogénéité cellulaire dans la tumeur elle-même doivent être sondées en combinant des modalités d’imagerie et d’évaluation moléculaire. Nous prévoyons également qu’INFORM peut fournir des informations clés sur plusieurs autres types de cancer, en particulier dans les cas où les marqueurs moléculaires associés aux résultats font défaut. Il est également probable que les algorithmes d’apprentissage automatique modernes puissent exploiter le potentiel du microenvironnement tumoral avec beaucoup plus de précision que les travaux présentés ici. Bien que ces méthodes soient puissantes, il est difficile d’expliquer d’où vient la prédiction. In this work, we have focused on trying to develop easy to interpret measures that can be readily understood, communicated and verified by human inspection if needed.
Last, primary limitations of this study come from the limited sample size and the need to sample the tumor from the invasive fronts. Evidence from this study demonstrates that there is power in the structural determinations of tumor to predict prognosis. However, a rigorous validation in a larger cohort is required. We anticipate that future studies would be able to expand the results from this work further both in terms of sample sizes and the diversity of the tumor microenvironment. In addition, although advanced machine learning models such as deep neural networks have not been applied here because of their limited interpretability and need for large sample sizes, such models can help in advancing this work to clinics. Last, our work demonstrates that combining multiple modalities such as imaging, spectroscopy, and computational modeling can prove beneficial in understanding and predicting tumor behavior. Further integration of modalities that bring complementary information such as genomics and metabolomics can further improve our ability to predict tumor behavior and make it more individualized.
Tumor stage and grade are crucial information for clinical management of cancer. However, these rely only on the characteristics of cancer cells. Prior studies have missed the opportunity to measure the spatial factors that can inhibit or promote tumor progression, controlling the spatial availability of signaling factors and nutrients. We used IR spectroscopic imaging with machine learning algorithms to reliably identify invasive epithelium and RS with pixel-level accuracy in addition to eight other unique histologic types. Next, we measured the tumor structure with respect to specific tumor microenvironment components such as the RS. Last, the interaction feature captured both the structure of tumor and the prevalence of RS. The 6-year probability of survival in “low-risk” patients was 0.73, whereas that in “high-risk” patients was 0.54 at P value of <0.0003. Remarkably, our model was independent of the stage and grade of the tumor in Cox multivariate hazards models. By integrating morphometry and biochemistry to define risk, our work provides a new technique to predict the tumor behavior. We show that while the tumor microenvironment changes are prognostic, an interaction model considering the extent of microenvironment modifications and the tumor morphology is a better predictor of prognosis. This work is especially critical for clinical evaluation of tumors that do not have defined patient outcomes associated with molecular features. Furthermore, our work defines a new dimension to evidence-based pathology and provides interpretable data that can greatly augment clinical practice (49). Recent developments in the field of chemical imaging enable stainless tissue characterization at clinically desirable speeds (50–53). We anticipate routinely applying INFORM in research and clinics, allowing automated diagnosis and outcome predictions that are interpretable and useful.
MATERIALS AND METHODS
Experimental design
The patient cohort used in this study comprised 320 anonymized patients undergoing elective surgery for colorectal carcinoma. Cores of 1-mm diameter were sampled for each patient from representative invasive areas of paraffin-embedded blocks and were used to construct eight TMAs. For some patients, normal colon mucosa samples were also included. This cohort has been used previously (54) and described in detail in the cited reference as cohort II.
Sample preparation
For HD-IR spectroscopic imaging, a 10-μm-thin section of each of the TMAs was obtained on barium fluoride substrate (55). A consecutive section was collected on a glass slide for H&E staining. Because of the IR absorbance of paraffin at 1462 cm−1 (56), before scanning, paraffin was removed by initially dripping the slide with cold hexane followed by complete submersion in continually stirred hexane for 48 hours at 40°C where the solvent was renewed every 3 hours. The disappearance of the representative peak over several locations on the slide confirmed the dissolution of the embedding medium. For supervised classification, data were annotated by labeling histologic classes on H&E images by collaborating pathologists. These annotations were manually copied on the IR spectroscopic images and served as ground truth. For evaluation of surgical resection, paraffin-embedded blocks of colon tissue were obtained from the Carle Foundation Hospital Urbana from anonymized deceased patients who underwent excisional surgery, and processed similarly to the TMA samples.
Imaging
High-magnification images were recorded on an Agilent 870 imaging system in high-magnification mode. This microscope was equipped with 128 × 128 element focal plane array Mercury-Cadmium-Telluride detector. Each pixel of size 1.1 μm was averaged over four scans, and the background spectrum was acquired at 120 scans per pixel on a clean area of the slide. HD-IR spectroscopic images were collected at a spectral resolution of 4 cm−1 and a step size of 2 cm−1 and subsequently truncated to the lower noise spectral range of 900 to 3800 cm−1, providing 1506 data points in the spectrum.
Preprocessing
After stitching the image tiles, noise reduction was performed using minimum noise fraction transform. Savitzky Golay 9 point smoothening, baseline correction, and normalization to amide I peak at 1650 cm−1 were done for each core in the TMA. The spectral data were converted to spectral metrics using methods described previously (56, 57). Briefly, we calculated spectral metrics as ratios of peak heights, peak area and heights, peak areas, and centroid wave number locations of the peaks. In total, we defined 418 spectral metrics.
Feature reduction
In the first stage of feature reduction, we performed analysis of variance (ANOVA) using a nested, random-effects interaction model on three arrays (a1, a3, and a4) using ground truth to label classes, patient, TMA, and patient core numbers. Because specific patients were only found in particular arrays and each patient had multiple cores, the nesting order was array, patient, and patient-specific core. For this analysis, the classes used were malignant epithelium, necrosis, and RS since these classes were most commonly observed in cores. From ANOVA, we determined spectral metrics where interarray, interpatient, and intercore variations were significant at the 0.05 significance level and removed these from the analysis. One hundred sixty-two metrics were retained after this stage. In the second stage, we used minimum redundancy maximum relevance algorithm (mRMR) in R to further remove redundant and irrelevant features. In this model, the feature with maximum mutual information is selected first following the equation (58)where Xje represents jeth feature in full dataset X, y represents the output variable (class label), and je represents mutual information given by
The next feature is added to feature vector S by finding the feature with minimum mutual information with respect to all the prior features in S and maximum mutual information with respect to the class label. This is represented as
Applying this using the mRMRe package in R, we found a set of 50 features that were relevant to the classification problem while minimizing the redundancy in the data (table S2).
Supervised classification
In the model learning step, we defined pixel labels for each cell type by duplicating annotations from H&E-stained sections as marked by an expert pathologist onto HD-IR spectroscopic images. Four arrays were used for training (a1 to a4). We used a random forest algorithm for supervised classification in Matlab 2016a. To address fitting issues in the classifier such as high bias or high variance, we used two additional arrays (a5 and a6) to perform optimization of parameters. The parameters that we optimized in the random forest were (i) leaf size, size of the group at which decision tree stops splitting further, and (ii) feature size, number of features sampled by the tree randomly for performing the split. The parameters were optimized by calculating the error in classification for both training and calibration sets for multiple leaf sizes and feature sizes given by
Where e represents error, w represents the weight of the class, n is the number of classes, y is the true class label, ŷ is predicted label, and je is indicator function. Parameters that minimized calibration error and maintained low training error were chosen as optimal. The leaf size and feature size determined for optimal fit were 500 and 7, respectively, with 50 total features and an ensemble of 50 decision trees (fig. S1C). The fully developed supervised model with optimal parameters was validated by two independent arrays (a7 and a8).
Statistical analysis
Classified images of invasive carcinoma cores from all eight TMAs were used for studying tumor-stroma interaction. A total of 245 patients were analyzed using TMA cores containing reactive or nonreactive stroma and at least 5% proliferative epithelium by area. If multiple cores from the same patient were present, then mean over all available cores was calculated. Each risk-associated variable was converted to a dichotomous categorical variable by splitting at the median and evaluated for significance by univariate log-rank test and multivariate Cox regression analysis in R using the package “survival.” Power analysis was performed in R using the package “powerSurvEpi.” Two-sample t test was performed in OriginPro 2017 to test the hypothesis that the means of groups were equal. Mann-Whitney test was performed in OriginPro 2017 as a nonparametric test to test if the distributions were different.
Progression analysis
Three risk-associated features were defined to assess the tumor-stroma interaction. The first risk variable was distance feature (réHC) and measured as the closest encounter distance of the malignant epithelium pixel to the stromal element being probed. The microenvironment HC density (NHC) was measured as the normalized pixel count of the stromal component being probed in a circle of radius R determined experimentally. Empirical work indicated that any radius above ~400 μm captured the spatial characteristics between normal and invasive cores. We set the R for our analysis to be 600 μm. The density factor NHC is the number of HC pixels in area πR2 to accommodate for centers close to the tissue edge. Risk variable interaction feature (jeHC) was measured as the interaction of the two features ré et N for each pixel. Five hundred random pixels of malignant epithelium were chosen from each of the 30% downsampled classified HD-IR image to calculate the features. Three stromal elements, the RS, lymphocytes, and normal stroma, were evaluated separately for their role in determining outcome.
REFERENCES AND NOTES
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
-
F. G. Zanjani, A. Panteli, S. Zinger, F. Van Der Sommen, T. Tan, B. Balluff, D. R. N. Vos, S. R. Ellis, R. M. A. Heeren, M. Lucas, H. A. Marquering, I. Jansen, C. D. Savci-Heijink, D. M. de Bruin, P. H. N. de With, in Proceedings – International Symposium on Biomedical Imaging (IEEE Computer Society, 2019), vols. 2019-April, pp. 674–678.
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
- ↵
Acknowledgments: We thank J. Pfister and S. Mittal for help with HD-IR data acquisition. Funding: S.T. was supported by the Beckman Institute Graduate Fellowship and the Nadine Barrie Smith Award. The development of IR imaging technology was funded by NIH grant R01EB009745 to R.B. The funding sources were not involved in study design, analysis and interpretation, writing of the report, and decision to submit the article for publication. Author contributions: S.T. and R.B. conceived the study design and experiments. S.T., A.K.-B., and J.W. performed the experiments and collected the data. S.T., A.K.-B., and R.B. analyzed and interpreted the results. S.T. and R.B. wrote the manuscript. R.B., G.C., S.M.H., and A.K.-B. supervised the work and revised the manuscript. All authors read and approved the final version of the manuscript. Competing interests: The authors declare that they have no competing interests. Data and materials availability: All data needed to evaluate the conclusions in the paper are present in the paper and/or the Supplementary Materials. Additional data related to this paper may be requested from the authors. HD-IR imaging data, H&E images and annotations, and data analysis are available upon request to the corresponding author.
- Copyright © 2021 The Authors, some rights reserved; exclusive licensee American Association for the Advancement of Science. No claim to original U.S. Government Works. Distributed under a Creative Commons Attribution NonCommercial License 4.0 (CC BY-NC).
Source de l’article