基因差异分析的三种分组

生物信息学最最基本的一种分析是基因差异分析,是将样本分为两组,展示两组之间的基因表达的差异,筛选出差异基因进行后续的分析,所以基因差异分析虽然基本却是所有分析的基础,具有相当的重要性。分组不同,差异基因也就可能不同。

目前对于癌症基因分析有三种类型的分组。
一种是癌组织和癌旁组织(近似正常组织)之间的对比分析,这种分析策略的组间差异较大,得到的差异基因难免庞杂,不易分析得到核心的hub基因;
另一种是基于一些预后指标进行分组,比如死亡、远处转移和复发等,使基因分析与重要的临床特征建立了关联,但是这些临床特征往往由多种因素所导致的共同结果,难以分析出单一的基因特征对临床特征进行解释;
第三种分组策略是使用预测变量进行分组,或者某种结局相关的独立危险因素来进行分组。分析获得的hub基因同时与该独立危险因素相关也与筛选独立危险因素的结局变量有关,可用来解释该临床因素成为独立危险因素的基因特征,同时也解释结局变量发生的部分原因,比如使用年龄进行分组而获取年龄相关的基因特征或者使用肿瘤局部淋巴结转移分期进行分组而获取相关的基因特征等等。我们也正在采用这种分组策略,对食管癌远处转移及其的独立危险因素相关的基因进行分析。该策略的应用是使用SEER数据库和TCGA数据库进行联合分析,因为TCGA收集样本时同时收集了相对应的临床信息。通过SEER数据库较大规模的数据分析出癌症远处转移或者死亡结局的独立危险因素,然后使用独立危险因素进行分组来获取差异基因,比如SEER数据库分析出食管癌中AJCC T4分期是独立危险因素,可以作为观察组,而T1-T3可以作为对照组, 然后下载TCGA数据库的基因数据和临床数据按照上述策略分为两组进行基因分析。

有时间的情况下,三种策略都可以进行尝试。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

预测模型的开发与应用研究

文中代码请大家随意

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值