零代码复现2-基于TGF-β个性化纯生信套路

零代码复现2更侧重于某一个特定的功能集,进行直接建模,这个功能集可以从文献中挖掘,KEGG 的通路,疾病的相关功能,单细胞分析等等,该工具盒适用面极广。

http://www.sxdyc.com/zeroCodeTool

该步骤总共分14个步骤进行

第一步:1.TCGA数据整理

该工具主要是用来整理TCGA的数据

整理一下TCGA的临床数据,从http://www.sxdyc.com/tcgaDataSet下载临床数据

第一列为样本名,第二列为生存时间,第三列为生存状态,前三列顺序不能变。

运行成功后,即可进行下一步

第二步:2、关键基因集表达

该步主要用来分析基因集癌组织和癌旁组织表达情况,这里以箱线图和热图进行展示(示例数据中提供给大家的TGF-β通路,大家可以换成自己感兴趣的功能集进行分析)

基因集长什么样子呢?只要包含一列就可以了

设置图片的颜色,大小,数据是否进行log转化,即可提交,等待运行成功即可

通过ssGSEA的方法计算特定功能集的评分,并通过秩和检验比较了癌组织和癌旁组织之间的差异

第三步:3、关键基因集snv突变

该工具主要用来查看我们关注的基因集snv的变化

选择任务队列即可

第四步:4、关键基因集CNV变化

该工具用量查看关键基因集CNV变化情况,并进行比较

第五步:5、分子亚型的构建

该工具针对我们关注的基因集构建分子亚型,这里使用ConsensusClusterPlus包进行一致性聚类,选择聚类方法、度量距离方法、标准化的方法

raw:不做任何处理的表达值;scale:按照样本进行scale和中心化,center:按照样本进行中心化,不进行scale

通过 ConsensusClusterPlus 包对特征基因的表达谱进行一致性聚类,同时利用(聚类的方法)算法和(度量距离的方法)作为度量距离,并进行了 500 次 bootstraps,每个 bootstraps 过程包括80%的训练集患者对样本进行聚类分析,这里仅输出2型,3型,4型的结果

第六步:6、分子亚型临床特征比较

该工具主要用来比较分子亚型临床特征的比较,要注意的是,这里需要选择亚群聚类的个数,默认是2,3,4选择一个,可以参考第五步中的2,3,4三个亚型KM曲线,保证预后有意义即P<0.05

第七步:7、分子亚型的突变特征

第八步:8、分子亚型的免疫分析

该工具使用cibersort预测22种免疫细胞丰度,并通过秩和检验比较两个亚型之间的

第九步:9、亚型的差异分析筛选关键基因集

该工具使用limma针对亚型进行差异比较

第十步:10、差异基因的富集分析

将第九步获取的差异的基因提取,进行GO和KEGG富集分析

第十一步:11、TCGA数据集构建风险模型

基于TCGA的数据构建风险模型,如果需要上传一个基因集,一般为差异分析的差异基因,首先会通过单因素cox分析筛选预后相关的基因(这里选择p<0.05),选择是否进行lasso,逐步回归进行分析,绘制ROC曲线的时间段,以及高低风险组的颜色进行后续分析

第十二步:12、验证集构建风险模型

需要准备一个geo的表达谱数据和生存数据

第一列为样本,第二列为生存时间,第三列为生存状态,记得顺序不要错!!!

如果选择训练集获取的计算风险模型系数(TCGA),则选择no,反之选择yes

第十三步:13.不同临床特征风险得分的比较

这里的颜色值得是临床特征的颜色,比如T分期有四个T1-T4,就会默认选择前四个颜色,M分期有两个,就会默认选择前两个

目前也有视频讲解:

https://www.bilibili.com/video/BV1o5411k72T/?spm_id_from=333.337.search-card.all.click

原文链接:

https://mp.weixin.qq.com/s/c4JodvtHu5XpkAWdDRZjpA

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值