科研的乐趣是探索未知揭开真相的欣喜。吾将锲而不舍破解蛋白酶作用机理的密码,无问西东。
背景介绍
生物催化已经成为传统的一个强大的替代化学,特别是对于不对称合成。工艺开发过程中的一个关键要求是发现具有适当的对映参照和对映选择性的生物催化剂,这可以通过蛋白质工程或宏基因组文库的筛选来实现。首先,使用合理的蛋白质设计来预测表明所需活性的关键氨基酸取代。然后,在蛋白质数据库中搜索已经携带这些突变体的蛋白质,而不是在实验室中构建相应的突变体。这种方法利用了自然进化的事实,即蛋白质经过了数百万年的选择,从而产生了高度优化的催化剂。利用这种方法发现了17种®选择性胺转氨酶,它催化几种®胺的合成,光学纯度高达>99%的对映体过量。
1、化学反应理论
光学纯化合物的生物催化合成既可以作为动力学分解,也可以作为不对称合成,如转氨酶催化反应的scheme 1所示。外消旋胺与(S)选择性外消旋酶的动力学分解产生®对映体。这种方法的缺点是只能达到50%的最大产量(scheme 1,左)。这种过程的原子效率很低,因为生成的酮价值很小,而且该化合物的循环需要化学还原胺化来产生外消旋胺以进行后续的分解。综合来说,不对称合成更经济,因为产率可能高达100%。然而,在这种情况下,将产生(S)胺(scheme 1,右)。
转氨酶属于5‘-磷酸吡哆醛(PLP)依赖的酶的I类和IV类。与α-氨基酸转氨酶(称为α-转氨酶,EC 2.6.1)相比,这是所有生物中普遍存在的酶,小部分胺转氨酶也转化缺乏α-羧酸部分的底物。这使得它们对光学活性胺的有机合成非常有吸引力,特别是由于产品范围不限于α-氨基酸。因此,迫切需要发现(R)选择性胺转氨酶,通过有效的不对称合成来获得广泛的(R)-胺(scheme 1,右)。
2、转氨酶修改策略
一种选择是从一个(S)选择性α-转氨酶的晶体结构开始,重新构建底物识别位点,以创建一个接受缺乏羧基的底物的变体功能(图1a),从而产生一个(R)选择性胺转氨酶。不幸的是,底物的α-羧基在底物结合过程中对α-转氨酶结构域的闭合起着重要作用。因此,为了解决这一挑战,可能需要许多额外的突变,但由于问题的复杂性,这一点无法预测。
另一种方法是通过在蛋白质数据库中使用硅策略来寻找具有互补对映体参照的酶(图1b)。从本质上,该方法基于两个步骤: (i)基于相关酶的结构信息来识别和预测重要的氨基酸残基和(ii)在蛋白质序列中数据挖掘。这一概念利用了现有的关于蛋白质功能的知识,并结合了在蛋白质序列数据库中存储的实验中未确定特征的巨大多样性。
3、结构信息分析
转氨酶有两种折叠类。迄今为止已知的所有属于plp依赖酶的折叠I类的α-转氨酶都是L-选择性的,在这一折叠类中没有描述过D-选择性氨基酸转氨酶。然而,D-氨基酸转氨酶(DATAs)是折叠类IV类的成员,值得注意的是,L-支链氨基酸转氨酶(BCATs)属于同一折叠类。这表明,在这一蛋白质折叠类中,底物识别底物的活性位点结构存在一定的灵活性,因此我们将研究重点放在折叠IV类转氨酶上。除了DATAs和BCATs,目前只有4-氨基-4-脱氧胆酸裂解酶(ADCL)被认为是折叠IV类的进一步成员。
DATAs和BCATs的对映体可以通过它们的晶体结构活性位点的底物配位差异来解释,活性位点由两个结合袋组成。如果α-羧基位于结合袋B中(图1a),该酶会转化L-氨基酸,从而表现出(S)偏好。然而,如果底物的α-羧基被容纳在结合袋A中,则该转氨酶是(R)选择性的,从而转化D-氨基酸。
这表明,所需的多样性可能在自然界中已经可用,而且只需要确定和利用它。根据这一推理,如果α-羧基结合袋发生修饰,(R)选择性胺转氨酶可能已经从(S)选择性α-转氨酶进化出来,允许小的疏水侧链结合而不是α-羧基功能。因此,一个(R)特异性胺转氨酶的合理祖先必须是一个L-(S)选择性的BCAT,根据CIP规则,一个L-氨基酸的羧基被一个甲基取代产生一个(R)-胺。
4、酶的关键特征
根据已知的晶体结构,研究了BCATs和DATAs中α-羧基的配位。这能够预测plp依赖的折叠IV类蛋白质中蛋白质序列的必要差异,这些差异决定了底物特异性从α-氨基酸到胺的期望开关,与对映体参考中的正式开关一致。在BCATs的情况下,口袋B中的底物结合比在DATAs和其他α-转氨酶中以更微妙的方式实现(Figure S1)。羧基氧原子没有直接接触到任何碱性氨基酸侧链,如精氨酸(图 2)。相反,一个羧基氧原子由Tyr95羟基配位,由相邻Arg97配位极化,另一个氧由Thr262和Ala263的两个主酰胺氮原子键合,由Arg40与相邻碳基配位激活(图 2和Figure S1;注意在相关序列中赖氨酸位于第40位)。
5、多序列比对
幸运的是,在活性位点中与底物直接接触的氨基酸被排列成两个相对较短的序列块。第一个块位于36-40位,第二个块由95-97位和107-109位的6个氨基酸组成。这些氨基酸大部分折叠成β片;只有107-109残基是环的一部分。这一信息很重要,因为在进化过程中,插入或缺失优先发生在环序列中,而不破坏酶活性,但通常不发生在α-螺旋或β-shees中。有助于plp依赖的折叠IV类酶的底物识别的残基在不同的酶中排列良好,除了在107-109位的基序中,我们有时观察到一到两个氨基酸的插入或缺失。对所有已知的BCAT、DATA和ADCL蛋白的实验验证结果表明,在这三组中,参与活性位点的氨基酸和底物识别的氨基酸似乎相当保守。
6、预测活性和对映体参考物的确认
对胺1-4和α-氨基酸5(D-丙氨酸)和6(L-谷氨酸)的®和(S)对映体的比活性用颜色梯度表示。蛋白质的编号与Table 1所示的一致(比活性和表达水平Table 2 和 Table 3)。然而,21个蛋白中有10个与至少一种被研究的胺具有比活性为 > 0.5 U m g − 1 >0.5Umg^{-1} >0.5Umg−1(Figure 3),这与已知的(S)选择性胺转氨酶45-47在相同的活性范围内。(一个单位(U)的活性被定义为每分钟产生1 μmol酮产物的酶的量。)
声明
希望理论指导(功能模体的空间序列)可以帮助到蛋白质AI模型从头设计的发展。
参考文献:doi: 10.1038/nchembio.447