R/S选择性胺转氨酶的模体设计指导发现新型转氨酶

python-码博士

已于 2023-03-01 19:25:54 修改

阅读量752

点赞数 1

分类专栏：酶学生物信息学文章标签：数据挖掘开发语言 r语言

于 2023-03-01 16:11:54 首次发布

本文链接：https://blog.csdn.net/m0_54634272/article/details/129269865

版权

生物信息学同时被 2 个专栏收录

10 篇文章 7 订阅

订阅专栏

酶学

3 篇文章 1 订阅

订阅专栏

文章目录

背景介绍
1、化学反应理论
2、转氨酶修改策略
3、结构信息分析
4、酶的关键特征
5、多序列比对
6、预测活性和对映体参考物的确认
声明

科研的乐趣是探索未知揭开真相的欣喜。吾将锲而不舍破解蛋白酶作用机理的密码，无问西东。

背景介绍

生物催化已经成为传统的一个强大的替代化学，特别是对于不对称合成。工艺开发过程中的一个关键要求是发现具有适当的对映参照和对映选择性的生物催化剂，这可以通过蛋白质工程或宏基因组文库的筛选来实现。首先，使用合理的蛋白质设计来预测表明所需活性的关键氨基酸取代。然后，在蛋白质数据库中搜索已经携带这些突变体的蛋白质，而不是在实验室中构建相应的突变体。这种方法利用了自然进化的事实，即蛋白质经过了数百万年的选择，从而产生了高度优化的催化剂。利用这种方法发现了17种®选择性胺转氨酶，它催化几种®胺的合成，光学纯度高达>99%的对映体过量。

1、化学反应理论

光学纯化合物的生物催化合成既可以作为动力学分解，也可以作为不对称合成，如转氨酶催化反应的scheme 1所示。外消旋胺与(S)选择性外消旋酶的动力学分解产生®对映体。这种方法的缺点是只能达到50%的最大产量（scheme 1，左）。这种过程的原子效率很低，因为生成的酮价值很小，而且该化合物的循环需要化学还原胺化来产生外消旋胺以进行后续的分解。综合来说，不对称合成更经济，因为产率可能高达100%。然而，在这种情况下，将产生(S)胺（scheme 1，右）。
转氨酶属于5‘-磷酸吡哆醛（PLP）依赖的酶的I类和IV类。与α-氨基酸转氨酶（称为α-转氨酶，EC 2.6.1）相比，这是所有生物中普遍存在的酶，小部分胺转氨酶也转化缺乏α-羧酸部分的底物。这使得它们对光学活性胺的有机合成非常有吸引力，特别是由于产品范围不限于α-氨基酸。因此，迫切需要发现（R)选择性胺转氨酶，通过有效的不对称合成来获得广泛的（R)-胺（scheme 1，右）。

scheme 1

在动力学分辨率（左）中，胺转氨酶在理想情况下只将一个胺对映体转化为相应的酮，剩余的对映体可以在高光学纯度和（理论）最大产率为50%。在不对称合成（右）中，促生酮对映化，直接产生光学活性胺。胺类转氨酶最常见的共底物是丙酮酸和丙氨酸。由于平衡有利于酮的形成，在不对称合成中，只能通过改变平衡才能获得高产量，例如通过酶去除形成的副产物丙酮酸。

2、转氨酶修改策略

一种选择是从一个（S)选择性α-转氨酶的晶体结构开始，重新构建底物识别位点，以创建一个接受缺乏羧基的底物的变体功能（图1a），从而产生一个（R)选择性胺转氨酶。不幸的是，底物的α-羧基在底物结合过程中对α-转氨酶结构域的闭合起着重要作用。因此，为了解决这一挑战，可能需要许多额外的突变，但由于问题的复杂性，这一点无法预测。

另一种方法是通过在蛋白质数据库中使用硅策略来寻找具有互补对映体参照的酶（图1b）。从本质上，该方法基于两个步骤： (i)基于相关酶的结构信息来识别和预测重要的氨基酸残基和（ii）在蛋白质序列中数据挖掘。这一概念利用了现有的关于蛋白质功能的知识，并结合了在蛋白质序列数据库中存储的实验中未确定特征的巨大多样性。

图 1

3、结构信息分析

转氨酶有两种折叠类。迄今为止已知的所有属于plp依赖酶的折叠I类的α-转氨酶都是L-选择性的，在这一折叠类中没有描述过D-选择性氨基酸转氨酶。然而，D-氨基酸转氨酶（DATAs）是折叠类IV类的成员，值得注意的是，L-支链氨基酸转氨酶（BCATs）属于同一折叠类。这表明，在这一蛋白质折叠类中，底物识别底物的活性位点结构存在一定的灵活性，因此我们将研究重点放在折叠IV类转氨酶上。除了DATAs和BCATs，目前只有4-氨基-4-脱氧胆酸裂解酶（ADCL）被认为是折叠IV类的进一步成员。
DATAs和BCATs的对映体可以通过它们的晶体结构活性位点的底物配位差异来解释，活性位点由两个结合袋组成。如果α-羧基位于结合袋B中（图1a)，该酶会转化L-氨基酸，从而表现出(S)偏好。然而，如果底物的α-羧基被容纳在结合袋A中，则该转氨酶是（R)选择性的，从而转化D-氨基酸。
这表明，所需的多样性可能在自然界中已经可用，而且只需要确定和利用它。根据这一推理，如果α-羧基结合袋发生修饰，（R)选择性胺转氨酶可能已经从(S)选择性α-转氨酶进化出来，允许小的疏水侧链结合而不是α-羧基功能。因此，一个（R)特异性胺转氨酶的合理祖先必须是一个L-(S)选择性的BCAT，根据CIP规则，一个L-氨基酸的羧基被一个甲基取代产生一个（R)-胺。

4、酶的关键特征

根据已知的晶体结构，研究了BCATs和DATAs中α-羧基的配位。这能够预测plp依赖的折叠IV类蛋白质中蛋白质序列的必要差异，这些差异决定了底物特异性从α-氨基酸到胺的期望开关，与对映体参考中的正式开关一致。在BCATs的情况下，口袋B中的底物结合比在DATAs和其他α-转氨酶中以更微妙的方式实现（Figure S1）。羧基氧原子没有直接接触到任何碱性氨基酸侧链，如精氨酸（图 2）。相反，一个羧基氧原子由Tyr95羟基配位，由相邻Arg97配位极化，另一个氧由Thr262和Ala263的两个主酰胺氮原子键合，由Arg40与相邻碳基配位激活(图 2和Figure S1；注意在相关序列中赖氨酸位于第40位）。

Figure S1

图 2

因此，胺类转氨酶在以下残基中应该不同于BCATs。首先，Tyr95应该与一种不能与羧基形成氢键的疏水残基。第二，Arg40应转变为不能通过相邻的主碳基氧配位激活Thr262和Ala263的酰胺主氮的残基。然而，关于plp依赖的折叠IV类蛋白中第40位的情况是复杂的。DATAs也有一个碱性氨基酸，Lys40，但与BCATs中的Arg40不同，DATAs中的Lys40改变了构象，使其ε-氨基与相邻环的主干形成一个氢键（图2和Figure S1）。因此，尽管在DATAs中存在Lys40，但结合袋B中羧基结合的酰胺主氮的激活被阻止。根据这一观察得出结论，如果在折叠IV类蛋白的其中一个序列中发现了Arg40或Lys40，那么该残基是否有助于携带α-羧基的底物的结合，则不能预测。总之，95位疏水氨基酸的存在和40位精氨酸或赖氨酸残基的缺失将是底物对胺特异性的明显改变。

5、多序列比对

幸运的是，在活性位点中与底物直接接触的氨基酸被排列成两个相对较短的序列块。第一个块位于36-40位，第二个块由95-97位和107-109位的6个氨基酸组成。这些氨基酸大部分折叠成β片；只有107-109残基是环的一部分。这一信息很重要，因为在进化过程中，插入或缺失优先发生在环序列中，而不破坏酶活性，但通常不发生在α-螺旋或β-shees中。有助于plp依赖的折叠IV类酶的底物识别的残基在不同的酶中排列良好，除了在107-109位的基序中，我们有时观察到一到两个氨基酸的插入或缺失。对所有已知的BCAT、DATA和ADCL蛋白的实验验证结果表明，在这三组中，参与活性位点的氨基酸和底物识别的氨基酸似乎相当保守。

Figure S2

这使得我们可以形成DATA、BCAT和ADCL活性的不同序列基序特征(图 2；关于序列基序中单个氨基酸的结构-功能关系的总结见Table S1和Table S2；多序列比对见Figure S3–5).在这些比较考虑的基础上，利用所识别出的氨基酸序列基序开发了一种注释算法（Figure S6）。这使得可以很容易地排除所有可以被明确指定为BCATs、ADCLs或DATAs的候选酶。对其余序列的分析，旨在确定满足所需的(R)选择性胺转氨酶活性要求的转氨酶序列。

Table S1

Table S2

Figure S3

Figure S4

Figure S5

Figure S6

利用该算法，分析了来自美国国家生物技术信息中心（NCBI）蛋白质数据库的约5700条注释为BCATs的序列和280条注释为PLP依赖折叠IV类蛋白的蛋白质序列。该研究鉴定了21个序列，其中7个来自真核生物，14个来自原核生物（Table 1）。这些序列符合我们的标准选择假定的(R)选择性胺转氨酶预测对映体：没有精氨酸或赖氨酸位置40序列和Phe95而不是Tyr95821序列表明基质有一个小烷基而不是α-羧基绑定到活性位点。在其他13个序列中，由于Tyr95残基上存在丙氨酸、谷氨酰胺、天冬氨酸或谷氨酸，因此Tyr95残基不太可能具有BCAT活性。因此，结合袋B中一个小烷基的配位似乎比α-羧基的结合更有可能，我们认为这是各自的蛋白质是胺转氨酶而不是BCATs的有力证据。为了传递(R)选择性，结合袋B应该只允许一个小的烷基的结合。在95位发现酪氨酸或苯丙氨酸的事实表明，与bcat相比，结合袋的大小并不大，因为这可以通过将Tyr95突变为一个小的疏水氨基酸，如丙氨酸或缬氨酸。

Table 1

6、预测活性和对映体参考物的确认

对胺1-4和α-氨基酸5（D-丙氨酸）和6（L-谷氨酸）的®和(S)对映体的比活性用颜色梯度表示。蛋白质的编号与Table 1所示的一致（比活性和表达水平Table 2 和 Table 3）。然而，21个蛋白中有10个与至少一种被研究的胺具有比活性为 $0.5Umg^{-1}$ （Figure 3），这与已知的(S)选择性胺转氨酶45-47在相同的活性范围内。（一个单位(U)的活性被定义为每分钟产生1 μmol酮产物的酶的量。）