谷歌新人工智能工具可准确构建基因组图像


2017年12月,谷歌发布了一款新的人工智能工具,可利用基因测序数据准确地构建人类的基因组图像。

虽然科学家在约十五年前就已经首次完成人类基因组的测序工作,但在十五年后的今天,理解编码人类生命的海量数据仍然是艰难挑战,而这正是机器学习技术擅长解决的那类问题。

谷歌于2017年12月4日星期一发布了一款名为DeepVariant的工具。该工具使用最新的人工智能(AI)技术,通过测序数据构建更加准确的人类基因组图像。

DeepVariant可帮助将高通量测序读数转换为全基因组图像。它会自动识别测序数据中的小型插入和缺失突变,以及单碱基对突变。

高通量测序技术在二十一世纪初得到广泛应用,让基因组测序变得更加普遍。但使用此类系统生成的数据仅能提供有限且容易出错的全基因组概况。对于科学家而言,将测序流程中生成的随机错误与小型突变区分开来十分具有挑战性,特别是在基因组的重复部分。这些突变可能会与癌症等疾病直接相关。

目前存在多款可用于解读此类读数的工具,其中包括GATK、VarDict和FreeBayes。但是,这些软件程序通常使用简单的统计方法和机器学习方法,尝试通过排除读取错误来确定突变。

“其中一个挑战在于基因组的疑难部分,每款[工具]都有其优势和劣势,”测试过DeepVariant早期版本的哈佛大学公共卫生学院研究科学家Brad Chapman表示。“这些疑难部分对于临床测序工作而言日益重要,因而必须采用多种方法。”

DeepVariant由来自谷歌大脑(Google Brain)团队(专注于开发和应用人工智能技术)和Verily(专注于生命科学领域的Alphabet[前身为谷歌]子公司)的研究人员开发。

该团队通过Genome in a Bottle(瓶中基因组,GIAB)项目收集了数百万高通量读数及全测序基因组。这个项目是公立部门和私立部门联合推动使用基因组测序工具及技术的成果。他们向深度学习系统提供数据并精心调整模型参数,直到相关模型学会以高准确度解读测序数据。

2016年,DeepVariant在美国食品药品监督管理局(FDA)举办的PrecisionFDA Truth Challenge比赛中赢得了第一名,这项比赛旨在推动更加准确地进行基因测序。

“DeepVariant的成功具有重要意义,因为它表明在基因组学领域,深度学习技术可用于自动训练表现优于复杂手动操作系统的系统,”加拿大Deep Genomics公司的首席执行官Brendan Frey说道。

DeepVariant的发布是机器学习技术有望推动基因组学进步的最新标志。

Deep Genomics是尝试使用人工智能方法(例如深度学习)梳理出疾病的发病基因并确定可能的药物疗法的数家公司之一。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值