法国科学家发布AI模型,阐释蛋白结构和功能及进化关系

https://www.toutiao.com/a6671451084893979143/

 

法国科学家发布AI模型,阐释蛋白结构和功能及进化关系

 

 

法国科学家最近发布了分析蛋白序列的AI工具,相关研究成果发表在权威杂志eLife (Learning protein constitutive motifs from sequence data)。研究人员开发了一种限制玻尔兹曼机器学习模型(Restricted Boltzmann Machines, RBM),通过对序列数据训练之后,模型能在蛋白结构、功能以及进化特征方面提供大量详细信息,这被认为是业界首次提出单纯依赖序列数据就能提取出如此详细信息的方法。

“蛋白序列的统计学分析可以让我们理解蛋白的结构、功能以及他们的进化历史,我们研究发现,我们设计的RBM模型,通过对高维复杂数据和特征的学习,可以基于序列信息有效的模拟蛋白的家族信息,我们利用RBM模型进行测试,通过对20个蛋白家族学习,模型对Kunitz和WW两个小蛋白结构域,一个伴侣蛋白Hsp70, 以及合成格点蛋白提供了详细的信息。”参与研究人员写道。

“RBM模型学习出来的特征具有很好的生物学可解释性,这些特征与结构如残基-残基之间的空间接触,α螺旋和β折叠等二级结构以及天然存在的无序区,与功能,如蛋白活性以及配体特异性,以及与系统发育一致性等密切相关,另外,我们利用RBM模型的不同模式,可以按照我们的意愿,设计出具有特定性质的全新蛋白序列。我们的研究表明RBM模型是一个研究蛋白家族基因型与表型关系实用而强大的研究工具”

文章作者Jérôme Tubiana,前巴黎高等师范学校物理实验室博士生指出,找到蛋白性质与对应的序列区域是一个关键问题,解决这个问题在生物医药方面具有重大意义。这可以帮助我们设计具有理想活性的新蛋白,或者预测蛋白质在生物体内(如致病菌)进化的方向,这样我们就可以提前发现治疗药物合适的蛋白靶点。

“我们的RBM模型显示人工智能技术可以解决复杂数据识别问题以及从数据中得到可解释的结论。在传统的数据科学中,普遍认为越复杂的模型,其可解释性越差,相反,我们模型具有强大的可解释性,同时,我们可以按照我们的意愿,生成具有特定功能的蛋白质。” 文章共同作者,物理实验室主任Simona Cocco博士说道,

原文链接:

Learning protein constitutive motifs from sequence data

https://elifesciences.org/articles/39397

中大唯信头条号与中大唯信公众号、唯信计算订阅号均由中大唯信科技有限公司运营,欢迎关注转发,未经授权禁止转载

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值