责编 | 兮
正常人一生中细胞分裂次数高达1016量级次【1】,每次细胞分裂都会伴随着体细胞突变的随机发生。不同类型的细胞发生突变概率不一,其中早期胚胎发育过程中平均每次细胞分裂随机产生约2-3个单碱基体细胞突变【2】。对正常人中体细胞突变的探索有助于了解人体发育过程和突变发生、累积机制,近期研究还显示体细胞突变会造成很多非癌症疾病,如局灶性皮质发育不良(Focal cortical dysplasia)、孤独症等【3】。然而检测非癌症样本中发生的体细胞突变具有很强的挑战性,因为:1. 随机发生的多数突变因没有选择优势而通常只存在于很小一部分细胞中,这给检测灵敏度造成了挑战;2. 这些伴随发育过程发生的突变往往广泛存在于多组织中,缺乏用于排除测序噪音和其他假阳性位点的对照样本,对检测准确性造成了困难。
2020年1月6日,来自哈佛医学院生物医学信息学系的Peter J. Park教授实验室团队(第一作者为窦岩梅博士)在Nature Biotechnology发表论文“Accurate detection of mosaic variants in sequencing data without matched controls”, 该研究开发了一个基于机器学习的工具“MosaicForecast”。与现有其他算法相比,MosaicForecast的检测特异性提高了数倍:实验验证显示MosaicForecast在一组全基因组数据中单碱基体细胞突变验证率达到80-90%,对短序列插入缺失达到60-80%的验证率。