百度计算生物研究登上Nature子刊!将3D结构引入分子表征,结果超越斯坦福MIT,已落地制药领域...

百度生物计算团队在Nature Machine Intelligence上发表研究,首次将3D结构引入分子表征,提出GEM模型,超越MIT、斯坦福,并已在制药领域实现落地。GEM模型通过几何增强的图神经网络和自监督学习,解决了小分子化合物性质预测问题,提升了药物研发效率。
摘要由CSDN通过智能技术生成
杨净 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

百度新研究,登上了Nature子刊。

科技公司卷到学术圈顶刊上不算稀奇。

但这次有点不同寻常。

研究领域与生物领域直接相关,接收该论文的期刊Nature Machine Intelligence(NMI),影响因子达到了16.649。

c951382ab46453a2386d83ac758b61fa.png

除了专业度保障,研究的实验结果也超越MIT斯坦福。

而且更关键的在于,跟后者大部分“产学研”模式不同。

百度是实打实自己独立搞出来的——

作者全部来自螺旋桨PaddleHelix,百度生物计算团队。

嗯,还是可复现的那种,目前GitHub上已经开源了完整代码(地址可在文末获取)。

研究人员表示,相关部分项目已经实现了商业化落地。

来看看究竟是一项什么样的研究。

小分子3D结构被AI整明白了

此次百度聚焦的研究,是小分子化合物性质预测

简单来说,通过小分子结构来预测其性质,帮助药物研发的早期探索,从而解决该领域成本高、时间长、成功率低等难题。

小分子药物结构有良好的空间分散性,其化学性质也更有助于成药,因此相较于大分子药物(蛋白质、核酸等)在药物研发上更有优势。市场上大部分药物也属于小分子药物。

53306d487100136b4b802994ca1a9d4d.png

但即便有先天优势,面临的特殊挑战也不小。

最大的挑战,莫过于小分子的筛选空间实在是太大了。

早前Nature一篇研究表明,小分子药物研发筛选数量在10的60次方。

什么概念呢?作者形容,“比太阳系的原子数量还要多”

要在这样一个庞大「小分子宇宙」中寻求合适的候选药物,高效准确的化合物表征就起到关键作用。

基于这样的背景下,研究团队此次的研究提出了几何增强型的分子表征方法,简称GEM

这个方法主要包含两个部分:基于空间结构的图神经网络GNN、以及多个几何级别的自监督学习。

不难看出,本次研究的亮点在于空间、几何

据介绍,这是业界首次将空间结构引入到化合物建模当中。

之所以这样强调,跟他们要解决的问题不无关系,那就是让AI也能理解小分子的3D结构。

个中原因,需要从现有表征方式说起。

目前研究主要有两种表征方式:基于序列的一维表征和基于图形的表征。

一个以字符串作为输入,利用序列模型比如RNN和Transformer来学习分子表征,但存在一些明显的局限性,比如字符串语法难以理解,两个相邻的原子在文本序列上可能相距甚远;字符串

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值