EnzyACT——融合图技术和蛋白质嵌入预测突变蛋白活性变化

论文链接:EnzyACT: A Novel Deep Learning Method to Predict the Impacts of Single and Multiple Mutations on Enzyme Activity | Journal of Chemical Information and Modeling (acs.org)

文章摘要 

            酶工程涉及通过引入突变来定制酶,以扩大天然酶的应用范围。其中一个限制是两个关键特性(活性和稳定性)之间的复杂相互作用,其中一个特性的增强通常会导致另一个特性的降低,也称为权衡机制。尽管已经开发了数十种预测突变后蛋白质稳定性变化的方法,但对活性影响的预测仍处于早期阶段。因此,开发一种快速准确的方法来预测突变对酶活性的影响有助于酶设计和理解权衡机制。在这里,作者介绍了一种新方法 EnzyACT,这是一种深度学习方法,融合了图技术和蛋白质嵌入来预测单个或多个突变后的活性变化。作者的模型结合了基于图的技术和语言模型来预测活性变化。此外,EnzyACT是在一个新的精选数据集上训练的,包括单点和多点突变。当在多个独立数据集上进行基准测试时,它在受突变影响的问题上表现出一致的性能。这项工作还提供了对远距离突变在活动设计中的影响的见解,这也有助于预测催化残基和开发改进的酶工程策略。 

概括:

本论文介绍了一种新方法 EnzyACT,这是一种深度学习方法,融合了图技术和蛋白质嵌入来预测单个或多个突变后的活性变化。作者的模型结合了基于图的技术和语言模型来预测活性变化。此外,EnzyACT是在一个新的精选数据集上训练的,包括单点和多点突变。

主要技术:

  单点突变预测模型(Model for Single-Point Mutation Prediction

  • 技术:图卷积网络(Graph Convolutional Network, GCN)
  • 解释:该部分使用预训练的蛋白质嵌入模型(ProtT5-XL-Uniref50)提取序列特征,并结合突变位点附近的空间邻接矩阵生成的图网络,捕捉残基间的短程交互。

  多点突变预测模型(Model for Multiple-Point Mutation Prediction

  • 技术:支持向量机分类器(Support Vector Classification, SVC)。
  • 解释:利用SVC模型对多点突变的活性变化进行预测,输入特征包括单点突变模型的输出和补充特征。

  分子动力学模拟(Molecular Dynamics Simulation

  • 技术:全原子分子动力学(Molecular Dynamics, MD)模拟。
  • 解释:使用NAMD软件在Amber力场下对P450酶的野生型和突变型结构进行0.5微秒的模拟,通过分析RMSD(均方根偏差)和自由能等指标,评估突变对酶稳定性的影响。

  MD轨迹分析(MD Trajectory Analysis

  • 技术:RMSD计算、自由能计算、动态交叉相关图(Dynamics Cross-Correlation Map, DCCM)分析。
  • 解释:利用AmberTools21套件分析MD轨迹中的残基间动态互作,帮助理解突变如何影响酶的整体稳定性和活性。

核心模型EnzyACT

.   EnzyACT 从蛋白质 3D 结构中提取两部分信息:交互网络和序列嵌入。蛋白质嵌入取自ProtT5-XL-Uniref50,每个方块代表一个1024维特征,然后将野生型和突变型连接后得到2048维特征。相互作用网络由距离突变位点小于12Å的残基组成。最后,通过GCN模型预测突变后的活性变化

输入(编码):

  • 输入蛋白质序列通过ProtT5-XL-Uniref50预训练模型进行编码,生成1024维的特征向量。
  • 突变位点附近的残基相互作用通过图卷积网络中的空间邻接矩阵来表示。

模型结构:

  • 单点突变预测模型:主要使用GCN,节点特征为蛋白质序列嵌入的1024维特征向量,通过邻接矩阵表示的残基间交互信息进入GCN模型进行处理。
  • 多点突变预测模型:利用SVC模型进行多点突变活性变化预测,单点突变预测的输出作为多点突变预测的输入特征之一。

训练:

  • 模型训练使用了从多个来源汇总的训练集,其中包括单点突变和多点突变的数据,采用五折交叉验证的方式评估模型性能。
  • 为了平衡数据集中的样本类别,采用了数据增强技术,例如反向突变数据的生成(即假设突变的影响与实际相反)以提高模型的鲁棒性。

模型输出:

  • 单点突变预测:预测突变对酶活性的影响,输出为酶活性的变化情况(如增加或减少)。
  • 多点突变预测:预测多个突变组合对酶活性的综合影响,输出为综合活性变化情况。

总的来说,EnzyACT模型通过结合图卷积网络和蛋白质序列嵌入技术,能够有效地预测单个或多个突变对酶活性的影响。这种方法不仅有助于酶工程设计,还能增进我们对酶活性与稳定性之间权衡机制的理解。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值