【论文阅读】ZymCTRL: a conditional language model for the controllable generation of artificial enzymes

论文阅读:ZymCTRL: a conditional language model for the controllable generation of artificial enzymes

1、研究背景

  • 研究问题:这篇文章旨在解决如何设计具有特定功能的人工酶的问题。酶因其复杂的活性位点能够加速化学转化而具有吸引力,且作为可生物降解的纳米材料,具有作为可持续大规模工业催化剂的巨大潜力。
  • 研究难点:尽管在酶设计领域取得了显著进展,但现有酶的催化速率通常低于其自然对应物,且设计过程中对序列特征的精确控制非常困难。
  • 相关工作:近年来,人工智能在蛋白质研究领域的应用取得了显著进展,特别是在结构预测和蛋白质设计方面。Transformer架构在自然语言处理领域的成功应用也启发了其在蛋白质设计中的应用。

2、研究方法

这篇论文提出了ZymCTRL,一种条件语言模型,用于根据用户提示生成特定类别的酶。具体来说,

  • 数据集准备:使用BRENDA数据库,该数据库包含3700万条酶序列,并根据其酶类别(EC)进行分类。为了确保模型的泛化能力,去除了具有多个标签的序列,最终得到3600万条序列
  • 模型训练:ZymCTRL采用Transformer架构的解码器模块进行训练,目标是生成酶序列。模型通过最小化负对数似然损失来学习EC控制标签与后续氨基酸之间的关系。公式如下:
  • 12
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值