在肿瘤数据挖掘中,单变量cox分析(单因素cox分析)和多变量cox分析(多因素cox分析)是非常重要的一个环节。他们的目的到底是什么了,之前看到他们在答疑群中经常群主会回复这么一句,你用几万个基因做多变量cox分析吗?这个肯定是不行?为此,我特意查了一下,这里的单变量cox分析是为了筛选单个基因与预后的关系,这里是可以选择用几万个基因进行盲筛的。
很多文章是怎么做的呢?
1、通过差异分析筛选疾病(肿瘤)发生发展相关的基因,然后通过单变量cox分析筛选预后相关的基因,如果基因数量比较多,有的会通过lasso分析进一步压缩基因数量(lasso分析),如果这时候筛选的基因数量还是比较多,可以选择使用逐步回归的方法进一步筛选基因。
2,通过相关性分析(如WGCNA)筛选相关的基因集,然后通过单变量cox分析筛选预后相关的基因,如果基因数量比较多,有的会通过lasso分析进一步压缩基因数量(lasso分析),如果这时候筛选的基因数量还是比较多,可以选择使用逐步回归的方法进一步筛选基因。
进行多因素cox分析的基因数量不会很多,这一点很重要,至少这个多到底多少算多呢?这个可以自行判断。
首先,看看无代码的状态如何进行单/多变量cox分析
http://www.sxdyc.com/coxAnalyse
需要上传两个文件,第一个文件表达谱数据,其中行为基因,列为样本,行名不能重复
第二个文件,生存数据,包含三列,第一列为样本,第二列为生存时间,第三列为生存状态,顺序不能变,列名无所谓
选择单因素cox/多因素cox分析即可。
单/多因素cox分析后,就是对应的可视化,他们平台将分析和可视化分开,cox分析最常用的就是用森林图去展示。
只需要上传一个五列的数据,顺序不要变动
选择输入图片的宽度和高度,选择样式就可以分析了
操作很简单,这里可以选择自己指定的基因,也可以自行排序,按照自己的顺序进行绘图,所以相对来说比较简单方便!