生存曲线(三):统计分析方法这么多,到底选哪个?
前面花了两期内容,讨论了如何使用软件(包括GraphPad Pri***、SPSS和Origin)绘制生存曲线。
生存曲线只是数据呈现的方式之一,其核心必须是统计结果。涉及统计,就不可避免地需要选择使用哪种统计方法。有时,你的数据没有统计意义,还真得回头看看统计方法是否选择正确了。
打开SPSS统计软件,录好数据后,点击生存分析,我们会发现软件中有4种可供使用的统计方法,此时到底该选择哪个呢?
本期主要以SPSS统计分析为例进行讨论,毕竟这个属于专业的统计软件,更加全面。
① 寿命表法
SPSS软件官方解释是这样描述的: 用从每个区间估计的概率估计在不同时间点发生该事件的整体概率。 “寿命表的基本概念是将观察区间划分为较小的时间区间。对于每个区间,使用所有观察至少该时长的人员计算该区间内发生终端事件的概率。 然后使用从每个区间估计的概率估计在不同时间点发生该事件的整体概率。”
上来就整这么一段话,估计打击有点懵。
举个例子。 假如一个临床实验需要随访2000人的生存时间(按月计算),此时会出现两个问题。***,我们很难做到及时、有效地随访每一位病人,不可能每个月都去问病人是否还活着?第二,如此大量的数据,我们在最终统计时,如果挨个录入,费时费力,极易出错。
别急,寿命表法为我们提供了有力帮助。
寿命表法本质是通过人为划分时间区间的方式,以频数方式呈现数据,采用加权法进行生存率分析的方法。注意, 此时的时间变量是不连续的。
例如上面的例子,我们可以人为划分时间区间为3个月,那么只要病人死亡发生在这个3个月内,都将其归入此区间,极大地减轻了随访难度。同时,以频数的方式呈现数据,无论多少个病人,只要其死亡时间在这个区间,频数就是多少,不用再细分每个死亡患者的具体死亡时间,可降低整理数据的难度。
因此,寿命表法适用于临床研究中的终点事件无法被有效、及时随访和大样本数据的生存分析。
② Kaplan-Meier法(又称乘积极限法)
SPSS官方解释又说了: Kaplan-Meier法与寿命表法的关键区别在于时间变量为连续变量,状态变量可以是分类变量或连续变量,因子和层次变量应为分类变量。
基于此,我们反推一下,可发现Kaplan-Meier法的要求需要时间变量为连续状态,就是说需要我们获取完整的、精确的生存资料。 Kaplan-Meier法本质是一个生存时间函数。
再举个例子,动物实验过程中,我们非常容易控制是动物数量、品系、性别的一致性,同时也冷非常准确及时地获取动物生存时间。有时,前脚刚出动物房,管理员就来电话说动物死了,这效率,杠杠的。此外,动物实验涉及的样本量一般不会特别大,就算一组动物20只,分5组,也才100只。
因此,Kaplan-Meier法比较适合动物实验这种小样本量的、观测记录较为完整的数据类或者大样本但未划分时间段的数据。
③ Cox 回归分析
SPSS官方解释贴心指出: Cox 回归数据分析时,其时间变量应是定量变量,但状态变量可以是分类或连续变量。
Cox回归分析本质是多因素分析,与之对应的上面的单因素分析(Kaplan-Meier法)。
理想状态下,我们非常希望有且只有1个因素影响生存率,便于我们更好地评价**作用。但现实往往不如人愿。临床研究中,经常会出现多个因素影响患者生存率,如果简单地套用单因素分析法,非常容易得出错误的研究结论。因此,我们必须要做Cox回归分析,充分评价观测因素以外的其它因素在患者生存率上回带来多大的影响。
举个例子。 评价新药和市售药**糖尿病时患者的生存率差异。我们都知道很多糖尿病患者都存在心梗、脑梗的风险,这些风险发生时均会导致患者死亡,必然影响我们最终的研究结论。此时即可采用Cox分析法。
重点来了。 尽管Cox回归分析看起来很符合实际操作情况,但是Cox回归分析也称为 Cox 比例风险模型 。
SPSS广泛统计中强调: 观察值应是独立的, 风险比应是时间恒定值 ;即,各个个案风险的比率不应随时间变化。后一个假设称为Cox 比例风险模型。
什么叫等比例风险? 预后因素对死亡风险的作用强度随着时间的变化需保持一致。
即,假设A、B两组糖尿病患者,分别给予新药和市售药,随访5年生存率。第1年A组风险死亡率是6%,B组是3%。第2年A组风险死亡率是10%,B组需为5%。此时才刚刚满足Cox风回归分析的前提。
验证是否为等比例风险的方法大致分两类。分类变量采用K-M生存曲线法查看是否存在交叉(若不交叉,则说明等比例风险);连续型变量采用残差散点图来判定(P>0.05表示)。(图例来自网络,侵删)
(K-M生存曲线法)
(残差散点图)
有人又会说了,这要求忒严格了吧,如果不是等比例风险呢?见下方。
④ Cox 依时协变量分析
若判定后发现不是等比例风险,说明影响影响因素在随着时间发生变化,此时可能需要采用带依时协变量的 Cox 过程。
感觉越说越远了......懵了吗朋友们
论文绘图丨手把手教你用Graphpad绘制生存曲线
以下文章来源于BioMan ,作者mBioMan
在临床研究中,生存曲线(又称Kaplan-Meier曲线)是最常用图片之一,旨在描述各组患者的生存状况。一张漂亮的、专业的生存曲线图不仅可以令编辑、读者和审稿专家眼前一亮,同时也能为论文增色不少。然而,对于一些新手而言,生存曲线却显得十分陌生,不知道为何要绘制生存曲线,也不知道该如何解读生存曲线的结果。
如何解读生存曲线呢?
(1)对于生存曲线,样本量越大,生存曲线越平滑,误差越小。
(2)一般而言,两条曲线之间的距离越大(分叉越大),说明两组患者预后(终点事件发生率)的差别越大,也越容易做出统计学差异。其实这个和t检验差不多:两组数据的均数差异越大,越容易有统计学差异。
(3)随访时间越长,越容易做出统计学差异。这个问题其实也很好理解,一个极端的比方就是,在上述sST2例子中,假定随访时间为1天,而非400天,两组患者生存率的差异显然是没有统计学意义的。国际上,随访时间越长的研究越容易发表在高水平的杂志上,原因与此有关。
(4)样本量越大,越容易做出统计学差异。样本量越大,误差(标准误)越小,当然越有统计学意义。其实这相当于在t检验中,两组数据的标准差越小,当然越容易得到阳性统计学结果。
(5)生存曲线与X轴有交叉,并不意味着研究对象全部死亡(发生终点事件)。实际上,在生存曲线中,每一个时间点上只要有病人死亡(或者发生终点事件),曲线就会下降一定的幅度。(参考知乎oriRNA)
接下来,我们就用Graphpad pri***9,和大家一起看看如何绘制生存曲线。
1. Survival curve-生存曲线
在有关差异表达基因和生物标志物模型分析中,经常会见到生存曲线分析。
(1)创建
(2)写入/导入数据
(3)Graphs
(4)结果,**组与对照组没有显著性差异。
(5)调整后的Graphs
双击图,弹出如下窗口,就可以编辑line的颜色等等。
(6)双击Y轴添加参考线。大多数研究会讨论中位生存时间。
双击Y轴,在”Additionalticks and grid lines“中写入0.5 (如果开始作图时选择”Percents“这里应写入50)点选 TickLine在Details按钮中选择参考线的颜色和线型即可。同样,也可以去添加X轴的参考线。
沃斯(WOSCI)由耶鲁大学博士团队匠心打造,专注最新科学动态并提供各类科研学术指导,包括:前沿科学新闻、出版信息、期刊解析、论文写作技巧、学术讲座、论文润色等。
生存曲线怎么做
1、首先用Excel做好数据的统计。
2、将数据整理成每个个体生存天数的形式,并将每个个体均定义为1。
3、打开GraphPadPri***后,选择Survival,选择图形类型和结果的显示方式,Fraction是以分数形式显示,Percents是以百分比形式显示,点击Create。
4、在DataTables的表格中将Excel的数据黏贴过来,注意实验组和对照组Y轴数值应写在不同列中。
5、点击Graphs中的Data1即可马上查看到制作好的生存曲线。
生存曲线有上升的吗
没有。生存曲线是将各个时点的生存率连接在一起的曲线图,它以时间t为横轴,生存率为纵轴。该曲线表示时间与生存率的关系,用以描述研究对象的生存过程,也可直观比较平时不同样本的生存率,所以这种曲线是没有上升的。
生存曲线的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于生存曲线图解读、生存曲线的信息别忘了在本站进行查找喔。