A Deep Cox Proportional Hazards Network_Step by step-CSDN博客

??

??ici

??DeepSurvThéano 和 Lasagne库实现的,支持训练网络模型,预测等功能。

考虑到DeepSurv库中存在着一些错误以及未实现的功能,博主使用目前主流的深度学习框架Tensorflow实现了深度生存分析库:TFDeepSurvÉtoile和Fourchette,指出错误,相互交流!

TFDeepSurv简介:基于tensorflow的深度生存分析框架,经过模拟数据和真实数据的测试。ties的建模,自定义神经网络结构及参数,可视化训练过程,输入训练数据特征重要性分析,病人生存函数的估计。还有支持使用科学的贝叶斯超参数优化??

TFDeepSurv各个功能实现参考的源论文!

introduction

????COX比例风险模型,神经网络恰好擅长学习复杂的非线性函数。

NN模型表现超过普通的COX模型,目前适用神经网络进行生存分析的主要的方法为:

  • ??
  • ??
  • Réseau Faraggi-Simon(前向NN,估计单个病人风险)

有很多基于Réseau Faraggi-Simon的方法,但是相比经典的COX比例风险没有明显的提升,原因是因为当时的NN研究还没有如今这么透彻!(现在有很多基于NN的优化方法,以及成熟的框架??

??

  • COX模型进行生存分析(总是好于经典模型)
  • ??

Fond

??

  • ??

    X

    X

    X??

    T

    T

    T??

    E

    E

    E.

  • E

    =

    0

    E = 0

    E=0??

    E

    =

    1

    E = 1

    E=1??

  • E

    =

    0

    E=0

    E=0 censuré à droite(右删失),在标准的回归模型中,这部分病人会被丢弃。

Réseau Faraggi-Simon

  • NN去学习非线性的风险函数
  • 只有一个隐藏层,2到3个神经元
  • COX比例风险模型,然后就没有下文了

Survie profonde

DeepSurv

  • .
  • 使用了更加先进的训练技巧,比如ReLU函数,Dropout,BatchNorm等方法.
  • .

??
??

Système de recommandation de traitement

  • .
  • COX模型,网络不需要先验知识(大致的意思就是不用人工提取重要特征).

Expériences

??

??indice de concordance (indice C),也就是一致性指数,其计算方式为:une paire est concordante avec les résultats réels si le patient présentant un risque prédit le plus élevé décède en premier. **Le C-index est le rapport entre le nombre de prédictions concordantes et l’ensemble de toutes les paires possibles. **(un événement non comparable, par exemple, est deux patients censurés ou un patient censuré avant le décès d’un autre)

??

????
ligne de base : une régression CPH linéaire pour une comparaison de ligne de base

  • Gaussien)的风险函数。每个实验数据包含训练、验证和测试集(

    N

    =

    10000

    N=10000

    N=1000010个,都服从[-1, 1]??

    T

    =

    E

    X

    p

    (

    ??

    0

    ??

    e

    h

    (

    X

    )

    )

    T = Exp(lambda_0 cdot e^{-h(x)})

    T=EXp(??0??eh(X))??

    h

    (

    X

    )

    h(x)

    h(X)NN具有筛选变量的功能。最后,选择了一个截止时间,使得数据中有30%-40%病人都有观测事件 .

  • infarctus du myocarde (IM) 生存分析,1638个观测病例和5个特征.

????

  • 线性风险函数数据:DeepSurv表现的和COX模型一样好,甚至误差远远小于COX模型。非线性风险函数数据:DeepSurv表现明显优于COX模型,C-index:0.612 vs 0.490。说明经典的COX模型在DNN却能很好地学习这种非线性的映射.
  • C-index,DeepSurv:COX = 0,779 vs 0,669.

然后还在真实的乳腺癌数据中进行了实验,发现C-index,DeepSurv:COX = 0,695 vs 0,688,得出结论:在风险分层上来说,C-index大的DeepSur模型更加好!

Expériences du système de recommandation de traitement

?? ??

Mes vues:

??

  • 伴随着DNN研究的深入,以及一些很好的优化方法和成熟的框架技术,使得基于DNN的生存分析能够进行。技术,不同研究领域的相互促进吧!
  • DNN熟悉的人肯定会问:网络结构是什么样的?如果调整确定的最佳网络参数?这些部分都没有给出一定的??
  • DeepSurv是否还会有较好的表现?这是值得怀疑的,而且利用医学的先验知识进行特征选择??

Source de l’article

A découvrir