1
鸟嘌呤(guanine)氧化成8-氧代鸟嘌呤(8-oxoguanine)是在基因组文库制备过程中,最常见的加接头前的伪影(artifacts)之一;形成的主要原因,是由于样品中的热量、剪切和金属污染共同产生(doi:10.1093/nar/gks1443)。
8-氧代鸟嘌呤碱基(8-oxoguanine)可与胞嘧啶(cytosine)或腺嘌呤(adenine)配对,最终导致 PCR 扩增过程中 G→T 的碱基颠换。
当模板链上的G被氧化时,将会使得A比C更具有亲和力。因此,在PCR过程中,reads1中将表现为G>T的替换,而在reads2中引入C>A的替换。
当在比对过程中,发生的 G>T 或 C>A 可能回事下述情况之一:
1、是真实突变
2、是8-OxoG伪影
3、是其他类型的伪影
变异(C→A)/(G→T)往往发生在特定的序列环境中,例如CCG→CAG(doi:10.1093/nar/gks1443)。虽然这些伪像发生在相对较低的频率下,但会对于变异检测的保真度会产生较为严重影响(doi:10.1093/nar/gks1443)。
2
虽然科学家们都非常清楚PCR和新一代测序过程中引入的误差,但是DNA提取和样本制备过程中产生的误差却很少受到关注。麻省理工学院布罗德研究所和哈佛大学的Gad Getz带领的一个研究小组,2013年在《Nucleic Acids Research》发表的一项研究中解决了这个问题,该研究发现了样本制备过程中发生的人为突变的一个新来源。
根据这项研究,位于超深覆盖目标捕获测序数据中低等位基因片段的C>A/G>T颠换偏差,是来自于包含提取过程反应污染物的样品在进行声剪切时的DNA氧化。往剪切缓冲液中添加金属螯合剂,可降低这些氧化偏差,一种后处理过滤法能够筛选出氧化引起的测序数据误差。这些研究结果表明,实验室程序的变化和信息工具的使用,可以帮助研究人员抑制人为偏差的影响。
3
发生在DNA提取和文库制备过程中,活性氧化物的来源主要是超声剪切这一步骤。
这个氧化伪影的信息学去除方法,可以通过设置链偏差进行过滤。
参考
https://gatk.broadinstitute.org/hc/en-us/articles/360035890571
http://www.ebiotrade.com/newsf/2014-10/20141013155129987.htm
《Discovery and characterization of artifactual mutations in deep coverage targeted capture sequencing data due to oxidative DNA damage during sample preparation》