零代码复现2更侧重于某一个特定的功能集,进行直接建模,这个功能集可以从文献中挖掘,KEGG 的通路,疾病的相关功能,单细胞分析等等,该工具盒适用面极广。
http://www.sxdyc.com/zeroCodeTool
该步骤总共分14个步骤进行
第一步:1.TCGA数据整理
该工具主要是用来整理TCGA的数据
整理一下TCGA的临床数据,从http://www.sxdyc.com/tcgaDataSet下载临床数据
第一列为样本名,第二列为生存时间,第三列为生存状态,前三列顺序不能变。
运行成功后,即可进行下一步
第二步:2、关键基因集表达
该步主要用来分析基因集癌组织和癌旁组织表达情况,这里以箱线图和热图进行展示(示例数据中提供给大家的TGF-β通路,大家可以换成自己感兴趣的功能集进行分析)
基因集长什么样子呢?只要包含一列就可以了
设置图片的颜色,大小,数据是否进行log转化,即可提交,等待运行成功即可
通过ssGSEA的方法计算特定功能集的评分,并通过秩和检验比较了癌组织和癌旁组织之间的差异
第三步:3、关键基因集snv突变
该工具主要用来查看我们关注的基因集snv的变化
选择任务队列即可
第四步:4、关键基因集CNV变化
该工具用量查看关键基因集CNV变化情况,并进行比较
第五步:5、分子亚型的构建
该工具针对我们关注的基因集构建分子亚型,这里使用ConsensusClusterPlus包进行一致性聚类,选择聚类方法、度量距离方法、标准化的方法
raw:不做任何处理的表达值;scale:按照样本进行scale和中心化,center:按照样本进行中心化,不进行scale
通过 ConsensusClusterPlus 包对特征基因的表达谱进行一致性聚类,同时利用(聚类的方法)算法和(度量距离的方法)作为度量距离,并进行了 500 次 bootstraps,每个 bootstraps 过程包括80%的训练集患者对样本进行聚类分析,这里仅输出2型,3型,4型的结果
第六步:6、分子亚型临床特征比较
该工具主要用来比较分子亚型临床特征的比较,要注意的是,这里需要选择亚群聚类的个数,默认是2,3,4选择一个,可以参考第五步中的2,3,4三个亚型KM曲线,保证预后有意义即P<0.05
第七步:7、分子亚型的突变特征
第八步:8、分子亚型的免疫分析
该工具使用cibersort预测22种免疫细胞丰度,并通过秩和检验比较两个亚型之间的
第九步:9、亚型的差异分析筛选关键基因集
该工具使用limma针对亚型进行差异比较
第十步:10、差异基因的富集分析
将第九步获取的差异的基因提取,进行GO和KEGG富集分析
第十一步:11、TCGA数据集构建风险模型
基于TCGA的数据构建风险模型,如果需要上传一个基因集,一般为差异分析的差异基因,首先会通过单因素cox分析筛选预后相关的基因(这里选择p<0.05),选择是否进行lasso,逐步回归进行分析,绘制ROC曲线的时间段,以及高低风险组的颜色进行后续分析
第十二步:12、验证集构建风险模型
需要准备一个geo的表达谱数据和生存数据
第一列为样本,第二列为生存时间,第三列为生存状态,记得顺序不要错!!!
如果选择训练集获取的计算风险模型系数(TCGA),则选择no,反之选择yes
第十三步:13.不同临床特征风险得分的比较
这里的颜色值得是临床特征的颜色,比如T分期有四个T1-T4,就会默认选择前四个颜色,M分期有两个,就会默认选择前两个
目前也有视频讲解:
https://www.bilibili.com/video/BV1o5411k72T/?spm_id_from=333.337.search-card.all.click
原文链接:
https://mp.weixin.qq.com/s/c4JodvtHu5XpkAWdDRZjpA