一.背景:
上一篇文章,我们介绍了随机序列种出现功能序列的概率,展示了如何从随机序列种识别出具有功能和类天然结构的新蛋白,同时也发现从随机序列中筛选出有功能的新蛋白是完全有可能的(大概1/10**11的概率)
第一篇笔记:蛋白质分子演化文献笔记——从随机序列中分离出功能蛋白 http://t.csdnimg.cn/sarHb
由于多数随机序列蛋白质可溶性低,难以鉴定其性状。一般的随机序列又容易形成聚合物,不利于进行功能的筛选和鉴定,也就不利于进行蛋白的定向进化了。
为了能在实验室中创造出较为稳定以及可溶的蛋白,Nobuhide Doi等人想模拟分子早期的演化,用演化初期含量最丰富的5种氨基酸构建只含有这几种原始氨基酸的随机序列并鉴定其功能,或许从中能筛选出功能性蛋白,或一窥生命的起源,也为实验室合成新蛋白提供了借鉴和思路。
二.生命演化初期的氨基酸
早期的氨基酸并没有现在这样多,而是随着蛋白质翻译的生化系统一起演化到现在的20种。推测地球上原始的氨基酸组成,可以帮助我们理解生命的起源。在米勒的火花放电实验中,模拟地球原始闪电带来的化学反应,在实验室生成了很可能是原始的氨基酸,分别是Ala、Gly、Val、Asp等。而对默奇森陨石(4900万年前坠落地球)的分析,其上含量最多的氨基酸又Ala、Gly、Val、Glu,有意思的是,这几种含量最高的蛋白质在今天的编译密码都以G开头(见下图)。
于是,选择密码子G开头的5种氨基酸Ala、Gly、Val、Asp、Glu作为随机序列组成的氨基酸(GNW片段)。 于是先构建下图顶部含有15个GNW的片段,然后在扩增后酶切链接,把(GWN)15连接呈(GWN)30... ...如此反复3轮,直到连接了8(2**3)个(GNW)15片段到随机序列中。
实验设计的序列两端分别是N-端T7 tag,作为Western Blot的探针结合位点;C-端的His6标签,用来纯化蛋白质。并且,在GNW随机序列之间散落着一些色氨酸(Trp),用于做荧光放射分析,揭示随机序列形成的蛋白结构。
三.由5种原始氨基酸组成的随机序列(VADEG)的特点
1.高度化学可溶性
VADEG具有高度化学可溶性,也就是在水和其他溶剂中可以溶解而不形成沉淀。不过,这和生物学上的可溶性是不一样的,生物学意义上的可溶性蛋白更多指向该蛋白可以发挥生化功能。
2.结构特点:
二级结构:VADEG蛋白没有明显的二级结构。尽管组成的氨基酸中Glu、Ala是易于形成螺旋结构的氨基酸,可是Gly会打破螺旋结构,也许这也导致VADEG不形成二级结构。
三级结构:根据随机序列中穿插的Trp荧光分析,几乎所有VADEG蛋白的Trp裸露在溶液中。除了G8这一条蛋白,形成了一些疏水结构将Trp包含起来。
而使用ANS染料进行荧光分析时,研究员发现大多数VADEG蛋白形成了疏水结构域。
ANS:4-氨基萘磺酸,在结合到蛋白质疏水结构域时紫外光激发出的荧光强度更大
3.VADEG随机序列多以单分子出现,不形成多聚物
在凝胶分子筛中,每种测试的VADEG随机序列蛋白除G4外都能一次洗脱出来,说明不形成各种复杂的聚合物,而根据洗脱流速计算的stocks半径也与单分子的蛋白或分子质量相近的球状蛋白半径相似。这一特点把VADEG与之前的20种氨基酸构成的随机序列区分开来,因为之前用非原始氨基酸组成的随机序列总是倾向形成多聚体,这样一来也就不利于功能鉴定和定向进化了。
四.阅读感想
这篇文章定义的可溶性与生物学上现行的定义不太一样,但是还是揭示了一些有趣的现象。这篇文章证明了实验室合成原始氨基酸组成的原始蛋白质也许与进化早期的蛋白质性质相似。更加灵活可变的结构,而不是由具体结构的蛋白质,更加可能出现在演化的早期,并且在蛋白质数量还没演化到非常庞大时,通过诱导折叠,这些没有固定结构的蛋白质可以结合更多的底物,发挥多样的功能。很有可能这篇文章证明了实验室能模拟出原始的蛋白质,而且也为设计可溶性高的蛋白提供了新的思路。