生信文献阅读俱乐部的首年活动进入尾期,部分俱乐部成员从头到尾坚持下来了,优秀程度不下于我!
这里展示澳大利亚胡同学的第20周的GWAS综述翻译稿件:
From genome- wide associations to candidate causal variants by statistical fine- mapping
摘要
从具有遗传标记的复杂性状的统计学关联推进到理解影响性状的功能性遗传变异往往是一个复杂的过程。精细定位可以选择遗传变异并对其进行优先级排序以供进一步研究,但是大量的分析策略和研究设计使得选择最佳方法具有挑战性。作者回顾了不同精细绘图方法的优缺点,强调了影响性能的主要因素。主题包括全基因组关联研究(GWAS)的解释结果,连锁不平衡的作用,统计精细绘图方法,跨种族研究,基因组注释和数据整合以及其他分析和设计问题。
很清晰的abstract,可以说一句废话都没有,同时让你很快了解到下文每一part讲的是什么内容。
基础知识预备
读Review 的好处就是你往往可以学到很多,或者加固一些知识。我主要是基于自己知识翻译,并且该文章主要于人类的GWAS相关,所以相关概念也是以人类的疾病等为例。
Genome- wide association studies (关联分析):扫描遗传标记,通常是单核苷酸多态性(SNPs),使用统计学相关的手段以发现与性状相关的变异体
Complex traits (杂合性状):
无论是由许多基因和环境因素共同作用引起的数量性状(例如血压和身高)还是常见疾病(例如癌症),每种效应都具有相对较小的影响,并且几乎不需要疾病发生就会产生该性状。
Tags SNPS (标签SNPs):
一般与邻近的SNP紧密相关,使得标签SNP充当未测量的SNP的替代物。
Linkage disequilibrium (连锁不平衡):
给定群体中单倍型上不同基因座的等位基因的非随机关联。LD是进行精细定位的关键,来自不同变体
没有等位基因的重组,但可以共同遗传某系性状,意味着变体在同一染色体上邻近。
Casual variants (因果变体):多个因果变体遗传变异在机制上对疾病或数量性状有贡献,但并不完全具有渗透性。因为单个变体可能不具有致病的能力。
Fine-mapping (精准定位):通过使用统计学,生物信息学或功能方法来改进因果变体的基因组定位
Penalized regression 刑罚化回归 :
一种通过最大化数据的对数似然性来估计回归系数的方法,同时放置限制回归系数大小的惩罚,将小系数收缩至零,有时恰好为零。尽管这会导致系数估计偏差,但它会通过减少系数估计的方差来改进模型的总体预测
Summary statistics 总结统计 :
衡量性状与一个或多个单核苷酸多态性(SNPs)之间的统计关联度量,其概括SNP对性状影响的大小,影响大小的变化以及影响大小如何相互关联。对于例子对照研究,总结统计包括逻辑回归估计的对数比率,对数比率的差异和对数比率之间的相关性。
Trans- ethnic 跨种族 :
一种遗传关联研究,包括来自不止一个种族背景的研究对象
Multiple testing correction 多重测试修正 :
当测试多个统计关联时,随着统计测试数量的增加,至少有一个significant的结果被宣告的概率会增加。如果m个独立统计检验中的每一个使用P值<>
Bonferroni校正使用P值
Statistical power