检测indel_如何在缺乏对照样本情况下准确检测体细胞突变

哈佛医学院的Peter J. Park教授团队开发了一种名为MosaicForecast的机器学习工具,能够在没有对照样本的情况下,准确检测体细胞突变,尤其是单碱基体细胞突变和短序列插入缺失。该工具通过read-level phasing进行训练,提高了检测特异性,避免了测序误差的影响,显著提升了体细胞突变检测的准确性。
摘要由CSDN通过智能技术生成

责编 | 兮

正常人一生中细胞分裂次数高达1016量级次【1】,每次细胞分裂都会伴随着体细胞突变的随机发生。不同类型的细胞发生突变概率不一,其中早期胚胎发育过程中平均每次细胞分裂随机产生约2-3个单碱基体细胞突变【2】。对正常人中体细胞突变的探索有助于了解人体发育过程和突变发生、累积机制,近期研究还显示体细胞突变会造成很多非癌症疾病,如局灶性皮质发育不良(Focal cortical dysplasia)、孤独症等【3】。然而检测非癌症样本中发生的体细胞突变具有很强的挑战性,因为:1. 随机发生的多数突变因没有选择优势而通常只存在于很小一部分细胞中,这给检测灵敏度造成了挑战;2. 这些伴随发育过程发生的突变往往广泛存在于多组织中,缺乏用于排除测序噪音和其他假阳性位点的对照样本,对检测准确性造成了困难。

2020年1月6日,来自哈佛医学院生物医学信息学系的Peter J. Park教授实验室团队(第一作者为窦岩梅博士)在Nature Biotechnology发表论文“Accurate detection of mosaic variants in sequencing data without matched controls”, 该研究开发了一个基于机器学习的工具“MosaicForecast”。与现有其他算法相比,MosaicForecast的检测特异性提高了数倍:实验验证显示MosaicForecast在一组全基因组数据中单碱基体细胞突变验证率达到80-90%,对短序列插入缺失达到60-80%的验证率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值