GWAS大家都耳熟能详, TWAS又是何方神圣

欢迎关注”生信修炼手册”!

GWAS称之为全基因组关联分析,是研究复杂疾病遗传易感性的一种方法,已经广泛应用于各种复杂疾病中,识别到了许多与疾病相关的SNP位点,然而GWAS识别到的很多SNP位点很多位于非编码区,位于非编码区的基因,也由于连锁不平衡的存在,无法确切定位致病的候选基因。只基于gwas的结果,仅能给出候选的染色体区域。

为了进一步缩小候选基因的范围,科学家们发明了很多的方法,比如根据SNP调控基因表达的思想, 可以进行eQTL的研究,通过GWAS和eQTL的共定位来筛选候选基因,本文要介绍的是另外一种方法TWAS。

TWAS全称如下

transcriptome-wide association studies

和GWAS类似,其分析内容都是寻找性状相关联的基因。不同的是,gwas是全基因组, 而TWAS则是全转录组。TWAS称之为全转录组关联分析,分析思路如下图所示

分为了三步

  1. 第一步,基于reference panel来建模,构建SNP和基因表达量之间的关系。reference panel中的样本同时拥有基因分型和表达量的结果,根据距离确定基因对应的SNP位点,比如选择基因上下游500kb或者1M范围内的SNP位点,拟合这些SNP位点和基因表达量之间的关系

  2. 第二步,用第一步建模的结果来预测另外一个队列的基因表达量,这个队列中的样本量只有GWAS结果,称之为gwas cohort, 这一步可以看做是对gwas cohort中的基因表达量进行填充

  3. 第三步,用填充之后的基因表达量来分析基因和性状之间的关联

TWAS已经成功应用于精神分裂症,乳腺癌,前列腺癌等疾病中,相关的数据分析软件也有很多,部分列表如下

  1. PrediXcan

  2. S-prediXcan

  3. Fusion

  4. UTMOST

PrediXcan适用于gwas cohort只有单个样本的情况,后三个软件则适用于gwas cohor为大量样本的gwas summary数据。还要一点需要注意,考虑到基因表达的组织/细胞类型的特异性,传统的TWAS方法要求reference panel和gwas cohort对应的组织/细胞类型相同,而UTMOST则进行了创新,通过整合多个不同组织的reference panel的数据,构建了数据库,允许对不同组织或细胞类型的gwas cohort进行基因型填充。

后续会介绍软件的详细用法,更多的知识推荐阅读以下两篇文献
1. Integrative approaches for large-scale transcriptome-wide association studies
2. Opportunities and challenges for transcriptome-wide association studies

转发本文到朋友圈,后台私信关键词”TWAS”, 即可获取以上文献。

原创不易,点个好看再走吧!

·end·

—如果喜欢,快分享给你的朋友们吧—

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

  更多精彩

  写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

生物信息入门

只差这一个

公众号

点击下方“阅读原文”,我们一起进步!

  • 5
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值