生存分析(Analyse de survie)、Cox风险比例回归模型(Modèle de risques proportionnels de Cox)及_dqhl1990的博客-CSDN博客_生存分析
生存分析(Analyse de survie)、Cox风险比例回归模型(Modèle de risques proportionnels de Cox)及C-index
1.
??1)癌症患者生存时间分析2)工程中的失败时间分析等等。
1.1
??
je
je
je??
(
X
je
,
??
je
,
T
je
)
(X_i, delta_i, T_i)
(Xje,??je,Tje)??
X
je
X_i
Xje??
T
je
T_i
Tje??
??
T
je
T_i
Tje??
??
je
=
1
delta_i = 1
??je=1??
??
T
je
T_i
Tje??
??
je
=
0
delta_i = 0
??je=0??
??
X
j
X_j
Xj??
1,2 (censuré)
censuré)。
??
1)censuré à droite)
2)在研究阶段,丢失了该实例
3)该实例经历了其他的事件导致无法继续跟踪
2 生存概率(Probabilité de survie)
??
S
(
t
)
=
P
r
(
T
>
t
)
S
S(t)=Pr(T>t)??
T
T
T??
t
t
t??
2.1 Estimation de survie de Kaplan-Meier
KM方法是一种无参数方法(non paramétrique)来从观察的生存时间来估计生存概率的方法。
??
m
m
m??
t
m
t_n
tm??
S
(
t
m
)
=
S
(
t
m
−
1
)
(
1
−
ré
m
r
m
)
S(t_n) = S(t_{n-1})(1-frac{d_n}{r_n})
S(tm)=S(tm−1)(1−rmrém)
??
S
(
t
m
−
1
)
S(t_{n-1})
S(tm−1)??
t
m
−
1
t_{n-1}
tm−1??
ré
m
d_n
rém??
t
m
t_n
tm??
r
m
r_n
rm??
t
m
t_n
tm??
t
m
−
1
t_{n-1}
tm−1??
t
m
t_n
tmcensuré,那么在计算
r
m
r_n
rm??
t
0
=
0
,
S
(
0
)
=
1
t_0=0, S(0)=1
t0=0,S(0)=1??
、Cox风险比例回归模型(Modele-de-risques-proportionnels-de-Cox)及_dqhl1990的博客-CSDN博客_生存分析.png)
KM生存分析模型可视化结果。其中,
1)曲线上垂直下降的部分表明,在该时刻有感兴趣的事件发生(通过观察
S
(
t
m
)
S(t_n)
S(tm)??
ré
m
d_n
rém??
S
(
t
m
−
1
)
S(t_{n-1})
S(tm−1)??
S
(
t
m
)
S(t_n)
S(tm)??
S
(
t
m
−
1
)
=
S
(
m
)
S(t_{n-1})=S(n)
S(tm−1)=S(m)??
2)曲线上的垂直bâton表示的是,在该时刻,有实例成为了censuré,如果在
t
m
−
1
t_{n-1}
tm−1??
t
m
t_n
tmcensuré,那么在计算
r
m
r_n
rm??
2.2 Test du Log-Rank 比较不同的生存曲线
在利用KM方法得到多条生存曲线后,只通过直接的观察来确定多条曲线之间是否具有显著性差异是不充分的。因此,test de log-rank被广泛的用来比较两条或多条??
1)test de log-rank是一种非参数检验,因此对于生存概率的分布没有任何假设;
2)同时,test du log-rank 的hypothèse nulle(原假设)为两个曲线代表的两个组之间,在生存率上没有显著性差异。
3)test de log-rank比较的是每个组中观察到的事件数,与在原假设为真的情况下,每个组期望的事件数。
4)test du log-rank统计量类似于卡方检验(Test du Chi carré)的统计量
3 风险概率(probabilité de danger)
??
t
t
t??
t
t
t??
h
(
t
)
=
limite
??
??
(
t
)
→
0
P
r
(
t
??
T
??
t
+
??
(
t
)
??
T
??
t
)
??
(
t
)
h
h(t)=??(t)→0limite??(t)Pr(t??T??t+??(t)??T??t)
3.1 risque cumulatif)
??
S
(
t
)
S
S(t)??
S
(
t
)
S
S(t)??
H
(
t
)
=
−
Journal
??
(
S
(
t
)
)
H
H(t)=−voilag(S(t))
??
S
(
t
)
S
S(t)??
H
(
t
)
H
H(t)、Cox风险比例回归模型(Modele-de-risques-proportionnels-de-Cox)及_dqhl1990的博客-CSDN博客_生存分析.png)
4 barreur 比例风险回归模型
4.1 为什么要用Cox 比例风险回归
上述生存分析模型,即Estimation de survie de Kaplan-Meier,是(analyse univariée)multi-variables?比如在比较两组病人拥有和不拥有某种基因型或/和 年龄的共同影响)
同时,Kaplan-Meier方法只能针对分类变量(治疗A contre 治疗B,男 contre 女),不能分析连续变量对生存造成的影响。
为了解决上述两种问题,Cox比例风险回归模型(Modèle de régression des risques proportionnels de Cox)就被提了出来。
4.2 Barreur 模型的定义
h
(
t
,
X
je
)
=
h
0
(
t
)
×
exp
??
(
X
je
??
)
h(t, X_i) = h_0
h(t,Xje)=h0(t)×exp(Xje??)
??
h
0
(
t
)
h_0
h0(t)??
t
t
t??
X
je
X_i
Xje??
je
je
je??
??
bêta
??cox部分似然得到的。
4.3 vraisemblance partielle
??
je
je
je??
T
je
T_i
Tje??
je
je
je??
L
je
(
??
)
=
h
(
T
je
,
X
je
)
??
j
:
T
j
??
T
je
h
(
T
je
,
X
j
)
L_i(beta) = frac{h(T_i, X_i)}{sum_{j:T_j geq T_i}h(T_i, X_j)}
Lje(??)=??j:Tj??Tjeh(Tje,Xj)h(Tje,Xje)
??
je
je
je??
T
je
T_i
Tje??
T
je
T_i
Tje??
??
T
je
T_i
Tje??
T
je
T_i
Tjecensuré应该不计入了吧,同时应该包含
h
(
T
je
,
X
je
)
h(T_i,X_i)
h(Tje,Xje)??
T
je
T_i
Tje??
??
je
je
je??
L
je
(
??
)
L_i(beta)
Lje(??)
L
je
(
??
)
=
h
(
T
je
,
X
je
)
??
j
:
T
j
??
T
je
h
(
T
je
,
X
j
)
=
h
0
(
T
je
)
×
exp
??
(
X
je
??
)
??
j
:
T
j
??
T
je
h
0
(
T
je
)
×
exp
??
(
X
j
??
)
=
exp
??
(
X
je
??
)
??
j
:
T
j
??
T
je
exp
??
(
X
j
??
)
L_i(beta) = frac{h(T_i, X_i)}{sum_{j:T_j geq T_i}h(T_i, X_j)} = frac{h_0(T_i)times exp(X_i beta )}{sum_{j:T_j geq T_i}h_0(T_i) times exp(X_j beta)} = frac{exp(X_i beta)}{sum_{j:T_j geq T_i} exp(X_j beta)}
Lje(??)=??j:Tj??Tjeh(Tje,Xj)h(Tje,Xje)=??j:Tj??Tjeh0(Tje)×exp(Xj??)h0(Tje)×exp(Xje??)=??j:Tj??Tjeexp(Xj??)exp(Xje??)
??
h
0
(
t
)
h_0
h0(t)probabilité partielle。
?? ??
L
(
??
)
=
??
je
:
??
je
=
1
exp
??
(
X
je
??
)
??
j
:
T
j
??
T
je
exp
??
(
X
j
??
)
L(beta) =prod_{i:delta_i=1} frac{exp(X_i beta)}{sum_{j:T_j geq T_i} exp(X_j beta)}
L(??)=je:??je=1????j:Tj??Tjeexp(Xj??)exp(Xje??)
??
??
je
:
??
je
=
1
prod_{i:delta_i = 1}
??je:??je=1??
??
L
(
??
)
L(beta)
L(??)??
??
bêta
????
argument
??
max
??
??
{
L
(
??
)
}
argmax_beta{ L(beta)}
arg??max{L(??)}
R语言实现Cox比例风险回归模型
Cox比例风险回归模型wiki
5 indice C
英文全称为indice de concordance。对于存在censuré实例的生存数据,一些标准的评估方法是不合适的,比如均方误差等等。
5.1
1)将所有样本两两配对,共组成
N
×
(
N
−
1
)
/
2
N fois (N-1)/2
N×(N−1)/2??
2)排除其中无法判断出谁先出现感兴趣事件的配对。比如配对中两个实例都没有出现感兴趣的事件;配对中的两个实例A、B,如果A是censuré(非censuré à droite) ??
T
UNE
T_A
TUNEB是发生事件的,其发生时间为
T
B
T_B
TB??
T
UNE
≪
T
B
T_A ≪ T_B
TUNE<TB??
M
M
M
3)在剩下的
M
M
M??
K
K
K??
S
(
X
UNE
)
≪
S
(
X
B
)
S(X_A) < S(X_B) S(XUNE)<S(XB)??
T
UNE
≪
T
B
T_A ≪ T_B
TUNE<TB??
4)则
c
−
je
m
ré
e
X
=
K
M
c-index = frac{K}{M}
c−jemréeX=MK
indice C的计算可由下列公式描述:
1
M
??
je
:
??
je
=
1
??
j
:
T
je
≪
T
j
je
[
S
(
T
i
,
X
i
)
< S ( T j , X j ) ] frac{1}{M}sum_{i:delta_i=1}sum_{j:T_i < T_j} je[S(T_i, X_i) < S(T_j, X_j)] M1je:??je=1??j:Tje<Tj??je[[[[S(Tje,Xje)<S(Tj,Xj)]
??
je
[
C
]
je[C]
je[[[[C]??
C
C
C??
je
[
C
]
=
1
je[C] = 1
je[[[[C]=1??
je
[
C
]
=
0
je[C] = 0
je[[[[C]=0??
??
??
je
:
??
je
=
1
sum_{i:delta_i = 1}
??je:??je=1??
??
??
j
:
T
je
≪
T
j
sum_{j:T_i < T_j} ??j:Tje<Tj??
T
j
T_j
Tj??
5.2 bootstrap 重抽样
robuste的评估结果,希望通过多次重复采样的方法来计算多组评估结果,从而得到更为有说服力的结果。
1)从原始样本中允许重复抽取的抽取一定数量的样本
2)根据抽取得到的新样本,计算统计量
T
T
TindexC-index
3)重复上述N次(一般大于1000),得到N个统计量
T
T
T
4)计算上述N个统计量
T
T
T??
Source de l’article