当前,关于高通量蛋白质组学的研究远不如NGS这般火热,网上关于这方面的知识也寥寥无几,从事这一行也有一段时间了,但还没好好总结过。加之过段时间可能要去做培训,所以是时候把知识点总结一下,权当复习。当然整个蛋白质组学研究也算纷繁复杂,不可能面面俱到,而且很多东西我也在学习当中,肯定会出现不少纰漏。毕竟这份笔记主要还是用于自我查漏补缺,要是在此之外还能帮到需要的朋友,也算善莫大焉了。
这一篇从原理开始讲起,后续会依次总结蛋白质组学鉴定、定量、注释、翻译后修饰、靶向等基础内容,当然最后也会讲到下游数据分析处理。
一、蛋白质组学概述
蛋白质组学是特定系统内蛋白质集合及其相互作用的研究。
蛋白质组研究本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识,这个概念是在1994年Marc Wilkins首次提出的。
为什么要研究蛋白质组学?
我想一句话就够了:蛋白质是生命活动的物质基础,是生命的执行者。
用业内通俗的话说解释各个组学的作用就是:基因组解释能发生什么?转录组解释将发生什么?蛋白组解释在发生什么?代谢组解释已发生什么?
蛋白质组学是后基因组时代的产物,作为中心法则的下游,其复杂程度远远超过基因组学。基因组的存在是相对稳定的,而细胞和细胞之间的蛋白质组则是随蛋白质和基因以及环境的生物化学反应而变化的。同一生物在生物体不同部位、生命的不同时期以及不同的环境中,具有不同的蛋白质表达。
人类基因组测序计划的完成并没有给人提供解开生命的密钥,科学家把兴趣转到蛋白质,希望通过蛋白质组的研究来进一步解开生命的本质。
二、质谱仪结构及原理
先看下面这张图,大致说明了蛋白质组学分析鉴定的流程。简单来说就是样本制备后分离进入质谱仪中,产出具有质荷比信息的实际谱图,再和数据库产生的理论谱图进行匹配打分,从而推断出蛋白信息。后续将会详解这一部分。
从上图我们可看出高通量蛋白质组学的研究离不开质谱仪,要想理解蛋白质组学数据分析原理,首先就要明白质谱仪的工作原理。
1.质谱仪的发展
质谱仪发展的几个标志性阶段:
上世纪初,JJ. Thomson发明第一台质谱仪;
40年代,质谱仪用于同位素测定和无机元素分析;
60年代,开始出现气相色谱-质谱联用仪应用于有机物分析;
80年代,以电喷雾、基质辅助激光解析电离为基础的液相色谱-质谱联用仪应用于蛋白质等生物大分子检测。
2.质谱仪结构
简单来说,质谱仪就是用来测定气态离子质荷比(m/z)的仪器。首先放个图,直观感受下质谱仪长啥样。嗯,我觉得比测序仪丑,但是价格却不比测序仪便宜。
质谱仪类型可分为无机质谱仪、同位素质谱仪、有机质谱仪、生物质谱仪。后两者用途比较广泛,用于蛋白质组学分析的质谱仪属于生物质谱仪,主要由以下几种结构组成。
1)进样系统
按物质形态,无非气体、固体、液体三种。按进样方式,有气体扩散进样、直接探针进样、色谱进样等。
2)离子源
离子源的作用是将被分析的样品分子电离成带电离子,并使其在光学系统作用下聚成一定形状和能量的离子束,然后进入质量分析器被分离。
离子源可分为硬源和软源,硬源离子化能量高,谱图复杂,可得到分子官能团信息;软源能量低,产生碎片少,谱图简单,可得到分子离子峰。常见硬软电离源如电子轰击电离源(EI)、化学电离源(CI)、场致电离源(FI)、场解析电离源(FD)、快原子轰击电离源(FAB)、大气压化学电离(APCI)、大气压光电离(APPI)、电喷雾电离(ESI)、基质辅助激光解析电离(MALDI)等等。
与GC串联的离子源有电子轰击电离源(EI)和化学电离源(CI),常用于代谢组学。与LC串联质谱的离子源有电喷雾离子化(ESI)、基质辅助激光解析电离(MALDI)大气压光电离(APPI)等,常用于蛋白质组学,也正是ESI和MALDI的发明获得了诺贝尔奖。
ESI采用强静电场(3-5KV),形成高度荷电雾状小液滴,经过反复的溶剂挥发-液滴裂分后,产生单个多电荷离子,电离过程中,产生多重质子化离子,主要用于LC-MS联用仪。
MALDI可使热敏感或不挥发的化合物由固相直接得到离子。波长为1250-775的真空紫外光辐射产生光致电离和解吸作用,获得分子离子和有结构信息的碎片,适于结构复杂、不易气化的大分子,并引入辅助基质减少过分碎裂。一般采用固体基质,基质样品比为10000/1。根据分析目的不同使用不同的基质和波长。