生存分析

求闻百科,共笔求闻

生存分析(英语:Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析存活率分析

生存分析涉及有关疾病的愈合、死亡,或者器官的生长发育等时效性指标。

某些研究虽然与生存无关,但由于研究中随访资料常因失访等原因造成某些数据观察不完全,要用专门方法进行统计处理,这类方法起源于对寿命资料的统计分析,故也称为生存分析。

关于生存函数(英语:survival function):

t表示某个时间,T表示生存的时间(寿命),Pr表示表示概率。生存函数就是寿命T大于t的概率。举例来说,人群中寿命超过50(t)岁的人在所有人中的概率是多少,就是生存函数要描述的。假定t=0时,也就是寿命超过0的概率为1;t趋近于无穷大,生存概率为0,没有人有永恒的生命[来源请求]。如果不符合这些前提假定,则不适应Survival analysis,而使用其他的方法。 由上可以推导:生存函数是一个单调非增函数。t越大,S(t)值越小。

衍生函数: Lifetime distribution function F(t) = 1-S(t) = Pr(T <= t)

概率密度函数: f(t) = d(F(t))/dt 又叫event density,单位时间事件event(可以是死亡或者机器失效)的概率,是生存函数的导数。

f(t) 的性质: f(t) 总是非负的(没有人可以再生)。函数曲线下方面积(从0到无穷大积分)为1。 s(t) = d(S(t))/dt = -f(t)

危险函数Hazard function λ(t) = f(t)/S(t) 危险函数引入分母S(t)。其物理意义是,如果t=50岁,λ(t)就是事件概率(死亡)除以50岁时的生存函数。因为年龄t越大,分母生存函数S(t)越小,假定死亡概率密度f(t)对任何年龄一样(这个不是survival analysis的假设),那么危险函数λ(t)值越大,预期存活时间短。综合很多因素,卖人身保险的对年龄大的收费越来越高。婴儿的死亡概率密度相对高一些,虽然分母生存函数S(t)大,λ(t)值还是略微偏高,交的人身保险费也略偏高。

相关书籍

  • 彭非, 王传. (2004). 生存分析. 中国人民大学出版社. ISBN 7300059562
  • 陈家鼎. (2005). 生存分析与可靠性. 北京大学出版社. ISBN 9787301053720

外部链接