欢迎关注公众号:oddxix
一、简介
1000 Genomes Project(缩写为1KGP)于2008年1月启动,是一项国际研究工作,旨在建立迄今为止最详细的人类遗传变异目录。科学家计划在接下来的三年内使用新开发的技术对来自不同种族群体的至少一千名匿名参与者的基因组进行测序,这些技术更快,更便宜。 2010年,该项目完成了试验阶段,在“自然”杂志的一篇出版物中对此进行了详细描述。2012年,1092个基因组的测序在Nature出版物中公布。 2015年,“自然”杂志上的两篇论文报告了结果,项目的完成以及未来研究的机会。确定了许多罕见的变异,仅限于密切相关的群体,并分析了8个结构变异类别。
该项目将来自世界各地研究所的多学科研究团队联合起来,包括中国,意大利,日本,肯尼亚,尼日利亚,秘鲁,英国和美国。每一个都将为庞大的序列数据集和精细的人类基因组图谱做出贡献,这些图谱将通过公共数据库免费提供给科学界和公众。
1000 Genome Project 的目标是发现在人群中频率大于1%的变异位点,对来自不同人群的大量样本进行测序,识别到了许多的变异位点,为人类遗传变异的研究提供了一个综合的资源。
1000个基因组项目的人口样本的位置,每个圆圈代表最终版本中的序列数
基因数量和顺序的变化(A-D)在群体内和群体之间产生遗传多样性
人类基因组由大约30亿个DNA碱基对组成,估计携带约20,000个蛋白质编码基因。在设计研究时,该联盟需要解决有关项目指标的若干关键问题,如技术挑战,数据质量标准和序列覆盖。
整个项目划分为四个阶段,试点阶段和三个主要阶段。
(1)为了确定整个项目的最终设计,设计了三个试点研究,并将在项目的第一年内进行:
-
第一个试点旨在对低覆盖率(2x)的3个主要地理群体的180个人进行基因分型。
-
第二项初步研究,两个核心家族(父母和成年子女)的基因组将进行深度覆盖(每个基因组20倍)的测序。
-
第三项试点研究涉及对1000名深度覆盖(20x)的1000个基因的编码区(外显子)进行测序。
(2)主要阶段中只有第一阶段和第三阶段产生了数据,每个阶段数据的详细情况如下图所示
image
主要阶段包括三个项目:
来自4个群体的180个个体的低覆盖度全基因组测序
2个三人组(母亲 - 孩子)的高覆盖率排序
来自7个群体的697个个体的外显子靶向测序