本文将围绕无创产前检测(Non-invasive Prenatal Testing, NIPT),为初入NIPT研究的新人提供基础知识,为生物信息研发人员梳理相关文献、总结关键研究内容。
一、NIPT研究背景
1. 染色体异常分类
从宏观到微观,染色体异常可分为:染色体层面的ROH异常、多倍体、非整倍体异常、染色体局部的拷贝数异常、基因层面的插入缺失异常, 分别对应不同的研究领域以及研究方法。孕期胎儿染色体异常种类检测如下:
2. 非整倍体异常
正常人细胞核内有23对共46条染色体,其中22对常染色体,1对性染色体。男性性染色体由一条X染色体和一条Y染色体组成,而女性是两条X染色体。染色体的数目异常包括整倍体和非整倍体两种情况:
整倍体:以人的一个染色体组(即n=23)为基数,整倍的增加或减少,正常人是二倍体,三倍体3n,有69条染色体,以此类推。如果胚胎为单倍体或多倍体是无法存活的。
非整倍体:当细胞染色体数目增加或减少了一条或数条,则称为非整倍体,是临床上最常见的染色体异常。我们最熟知的21三体唐氏综合征等属于这一类型,这类患者比常人多了一条21号染色体,主要表现为智力、生长发育迟缓、头面部特征等,非整倍体的产生往往与细胞分裂时染色体不分离、染色体丢失相关。18三体综合征:也叫“爱德华兹综合征”,13三体综合征:又叫“PATAU综合征”。大部分具有这种核型的个体会在胚胎期流产,少数存活的患儿也往往具有智力障碍、生长发育障碍、多发畸形等。染色体的非整倍体异常,是无创产前检测(NIPT)的主要检测内容。
3. NIPT
无创产前检查,利用孕妇的外周血游离DNA(游离DNA指血浆中自然条件下已经片段化的DNA)检测胎儿是否存在染色体非整数倍异常。NIPT的理论基础是1997年卢煜明教授在怀有男胎的孕妇血浆中分离出Y染色体片段,因此孕妇血浆中包含胎儿游离DNA。
与以创伤性诊断方法为主的具有一定流产风险的产前诊断相比,包括孕早期的绒毛穿刺,孕中期的羊水穿刺和孕晚期的脐带穿刺等,NIPT的优势在于无创,减少不必要的穿刺,缓解产前诊断实验室压力,减少因穿刺而导致的流产,减少孕妇焦虑,减少漏诊等。
二、NIPT生信分析方法
1. NIPT 生信分析
NIPT生信分析方法分为:基于z-score、normalized chromosome value、genome-wide normalized respective chromosome等方法。本文将基于z-score方法作详细介绍。
- Normalized chromosome value (Sehnert AJ, Rhees B, Comstock D et al: Optimal detection of fetal chromosomal abnormalities by massively parallel DNA sequencing of cell-free fetal DNA from maternal blood. ) 与z-score 类似,但计算z值数值使用不同的normalized 方法,使用代表性的参考染色体比对条数作为分母计算比例,如选择9号染色体作为计算21号染色体的参考分母。目的是避免z-score依赖比对序列条数带来的波动。
- genome-wide normalized respective chromosome (Yeang CH, Ma GC, Hsu HW et al: Genome-wide normalized score: a novel algorithm to detect fetal trisomy 21 during non-invasive prenatal testing. ) 使用染色体长度对染色体比对条数比例chrN%进行normalized。
- z-score: 使用染色体比对条数比例chrN%、正常样本构建的参考分布参数、计算Z值,与正常样本构建的参考偏离程度大的,即|Z|>3,则认为发生非整倍体异常。基本方法:序列质量控制、比对、统计比对到各染色体上的序列数、与建立的整倍体参考分布对比获取z-score。后续研究内容,围绕Z值方法的优化进行,即使用GC校正后的比对计数提高灵敏度,优化高Z值假阳性,准确统计胎儿浓度以及对应的可靠测序数据量等。
2. z-score 相关阅读文献
- (2008)Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma. 首次提出Z-score的检测方法,并且分析CV、GC含量对Z值判别准确性的影响。
根据GC含量将染色体分为5组,从1组到5组GC含量逐渐增高。2组、3组的CV最低,预示着21、18的Z值检测判别方法较1组里的13染色体判别准确。
- (2011)Noninvasive prenatal diagnosis of fetal trisomy 18 and trisomy 13 by maternal plasma DNA sequencing. 对早前2008年z-score检测方法,针对13、18染色体的z值方法改进:使用GC校正后序列数进行Z值判别。
- (2010)Sensitivity of Noninvasive Prenatal Detection of Fetal Aneuploidy from Maternal Plasma Using Shotgun Sequencing Is Limited Only by Counting Statistics. 施加权重的方法进行GC校正。提出:灵敏度仅受测序序列数限制,只需对更多的DNA分子进行测序,就可以将含有任意小部分胎儿DNA的样品的灵敏度提高到任意精度。
- (2012)Summarizing and correcting the GC content bias in high-throughput sequencing. 提出一种更有效的GC校正方法。
- (2012)Noninvasive Fetal Trisomy (NIFTY) test: an advanced noninvasive prenatal diagnosis methodology for fetal autosomal and sex chromosomal aneuploidies. 华大基因NIFTY:用概率替代z值作为常染色体、性染色体、性别的判断。
- (2014)Noninvasive prenatal diagnosis of common aneuploidies by semiconductor sequencing. 博奥NIPT:3步GC校正法(LOESS回归、同run间样本归一化、不同run间线性回归)
- (2015)Noninvasive prenatal testing using a novel analysis pipeline to screen for all autosomal fetal aneuploidies improves pregnancy management. 区分了胎儿三体性引起的高 z 评分与母体局部 CNV 引起假阳性引起的高 Z 评分:除了使用z-score(染色体水平z值),还增加了zz-score(常染色体与剩余染色体的z值比较)、BM(常染色体内局部区域的Z值中位数)、OM(剩余常染色体内局部区域的Z值中位数)。
三、NIPT研究内容
NIPT 目前研究、优化的方向、内容有:
- GC 校正和比对基因组区域筛选降低噪音。
- 不同胎儿DNA浓度下所需的测序数据量。
- 男性、女性胎儿DNA浓度估算。
- 性染色体异常检测。
- 母源CNV导致的假阳、嵌合体识别。
合木千行生信团队,具有NIPT分析服务能力,使用Z-score方法,沿袭多篇文章GC校正和基因组区域筛选经验,并且使用类似zz-score、BM、OM参数,区分母体局部CNV的假阳,具有极高检测灵敏度和特异性。