生存分析（Analyse de survie）、Cox风险比例回归模型（Modèle de risques proportionnels de Cox）及_dqhl1990的博客-CSDN博客_生存分析

Conseils
8 novembre 2021
499
174 minutes read

Facebook X Reddit Pinterest

生存分析（Analyse de survie）、Cox风险比例回归模型（Modèle de risques proportionnels de Cox）及C-index

1.

??1）癌症患者生存时间分析2）工程中的失败时间分析等等。

1.1

(

)

(X_i, delta_i, T_i)

X_i

$??$

T_i

$??$

T_i

$??$

delta_i = 1

T_i

$??$

delta_i = 0

X_j

$??$

1,2 (censuré)

censuré）。

??
1)censuré à droite）
2）在研究阶段，丢失了该实例
3）该实例经历了其他的事件导致无法继续跟踪

2 生存概率(Probabilité de survie)

(

)

(

)

2.1 Estimation de survie de Kaplan-Meier

KM方法是一种无参数方法(non paramétrique)来从观察的生存时间来估计生存概率的方法。

t_n

$??$

(

)

(

−

)

(

−

ré

)

S(t_n) = S(t_{n-1})(1-frac{d_n}{r_n})

(

−

)

S(t_{n-1})

$??$

−

t_{n-1}

$??$

ré

d_n

$??$

t_n

$??$

r_n

$??$

t_n

$??$

−

t_{n-1}

$??$

t_n

$censuré，那么在计算$

r_n

$??$

(

)

t_0=0, S(0)=1

R语言实现KM生存分析示例

KM生存分析模型可视化结果。其中，

1）曲线上垂直下降的部分表明，在该时刻有感兴趣的事件发生（通过观察

(

)

S(t_n)

$??$

ré

d_n

$??$

(

−

)

S(t_{n-1})

$??$

(

)

S(t_n)

$??$

(

−

)

(

)

S(t_{n-1})=S(n)

2)曲线上的垂直bâton表示的是，在该时刻，有实例成为了censuré，如果在

−

t_{n-1}

$??$

t_n

$censuré，那么在计算$

r_n

$??$

2.2 Test du Log-Rank 比较不同的生存曲线

在利用KM方法得到多条生存曲线后，只通过直接的观察来确定多条曲线之间是否具有显著性差异是不充分的。因此，test de log-rank被广泛的用来比较两条或多条??

1）test de log-rank是一种非参数检验，因此对于生存概率的分布没有任何假设；
2）同时，test du log-rank 的hypothèse nulle（原假设）为两个曲线代表的两个组之间，在生存率上没有显著性差异。
3）test de log-rank比较的是每个组中观察到的事件数，与在原假设为真的情况下，每个组期望的事件数。
4）test du log-rank统计量类似于卡方检验（Test du Chi carré）的统计量

3 风险概率(probabilité de danger)

(

)

limite

(

)

→

(

)

(

)

3.1 risque cumulatif）

(

)

(

)

(

)

−

Journal

(

)

$??$

(

)

(

)

4 barreur 比例风险回归模型

4.1 为什么要用Cox 比例风险回归

上述生存分析模型，即Estimation de survie de Kaplan-Meier，是(analyse univariée)multi-variables？比如在比较两组病人拥有和不拥有某种基因型或/和年龄的共同影响）

同时，Kaplan-Meier方法只能针对分类变量（治疗A contre 治疗B，男 contre 女），不能分析连续变量对生存造成的影响。

为了解决上述两种问题，Cox比例风险回归模型（Modèle de régression des risques proportionnels de Cox）就被提了出来。

4.2 Barreur 模型的定义

(

)

(

)

exp

(

)

h(t, X_i) = h_0

(

)

h_0

$??$

X_i

$??$

bêta

cox部分似然得到的。

4.3 vraisemblance partielle

T_i

$??$

(

)

(

)

(

)

L_i(beta) = frac{h(T_i, X_i)}{sum_{j:T_j geq T_i}h(T_i, X_j)}

T_i

$??$

T_i

$??$

T_i

$??$

T_i

$censuré应该不计入了吧，同时应该包含$

(

)

h(T_i,X_i)

T_i

$??$

(

)

L_i(beta)

(

)

(

)

(

)

(

)

exp

(

)

(

)

exp

(

)

exp

(

)

exp

(

)

L_i(beta) = frac{h(T_i, X_i)}{sum_{j:T_j geq T_i}h(T_i, X_j)} = frac{h_0(T_i)times exp(X_i beta )}{sum_{j:T_j geq T_i}h_0(T_i) times exp(X_j beta)} = frac{exp(X_i beta)}{sum_{j:T_j geq T_i} exp(X_j beta)}

(

)

h_0

$probabilité partielle。$

?? ??

(

)

exp

(

)

exp

(

)

L(beta) =prod_{i:delta_i=1} frac{exp(X_i beta)}{sum_{j:T_j geq T_i} exp(X_j beta)}

prod_{i:delta_i = 1}

(

)

L(beta)

bêta

argument

max

{

(

)

}

argmax_beta{ L(beta)}

R语言实现Cox比例风险回归模型
Cox比例风险回归模型wiki

5 indice C

英文全称为indice de concordance。对于存在censuré实例的生存数据，一些标准的评估方法是不合适的，比如均方误差等等。

5.1

1）将所有样本两两配对，共组成

(

−

)

N fois (N-1)/2

UNE

T_A

$B是发生事件的，其发生时间为$

T_B

$??$

UNE

≪

T_A ≪ T_B

3）在剩下的

(

UNE

)

≪

(

)

S(X_A) < S(X_B)

UNE

≪

T_A ≪ T_B

−

ré

c-index = frac{K}{M}

indice C的计算可由下列公式描述：

≪

[

(

)

< S ( T j , X j ) ] frac{1}{M}sum_{i:delta_i=1}sum_{j:T_i < T_j} je[S(T_i, X_i) < S(T_j, X_j)]

[

]

je[C]

[

]

je[C] = 1

$??$

[

]

je[C] = 0

$?? ??$

sum_{i:delta_i = 1}

≪

sum_{j:T_i < T_j}

T_j

$??$

5.2 bootstrap 重抽样

robuste的评估结果，希望通过多次重复采样的方法来计算多组评估结果，从而得到更为有说服力的结果。

1）从原始样本中允许重复抽取的抽取一定数量的样本
2）根据抽取得到的新样本，计算统计量

indexC-index
3）重复上述N次（一般大于1000），得到N个统计量

4）计算上述N个统计量

Source de l’article

Post Views: 989

A découvrir