生物科学领域中,对蛋白质的研究与分析可谓必不可少,如何利用蛋白质数据库灵活高效地分析实验中的目的蛋白,是实验成功的关键!
如何在成千上万的差异蛋白中进行筛选?
如何研究蛋白质序列、功能、结构、修饰?
如何查找目的蛋白相关文献?
今天小优就带大家入门学习三个蛋白组学数据库的应用,帮助大家提高实验效率!
01、 UniProt数据库
蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费蛋白质数据库。
那么如何利用如此强大的工具查询我们的蛋白质信息呢?
1. 在浏览器中输入https://www.uniprot.org/打开UniProt页面,在顶部搜索栏中输入蛋白质名称或编号,根据需要选择数据库和高级筛选后,点击search即可进入搜索结果页面。
2. 以人源PD1蛋白为例,进入蛋白详细信息界面后,可以首先看到PD1蛋白的[Function]即功能介绍,该板块总结了PD1蛋白的基本功能和主要参与的生物学过程,可点击其中对应的超链接查询参考文献。
之后是[Names&Taxonomy]即名称与分类板块,这里介绍了PD1蛋白的命名和来源种属、NCBI分类编号、分离族谱、种属详细信息、蛋白组学信息等。
3. 接下来的几个板块和我们的蛋白实验息息相关,包括[Subcellular location]亚细胞定位、[PTM/Processing]翻译后修饰、[Expression]表达情况、[Interaction]蛋白相互作用等。
在这几个板块中我们可以找到蛋白质或基因在细胞/组织中的表达情况,蛋白质在亚细胞结构中的定位,蛋白质的翻译后修饰有哪些,PD1与哪些蛋白有相互作用等信息。
例如PD1主要表达在淋巴结、心脏、血液、粒细胞、脾脏等,它的亚细胞定位为细胞膜,所以在做IHC或IF时我们应该知道PD1阳性信号的正确位置了。
PD1的翻译后修饰包括糖基化、二硫键等,其修饰位点也可从下图板块中找到。
4. 在做WB实验时我们往往会发现一些蛋白的实际检测分子量和期望分子量有一定的差异,这时我们就可以运用[Sequence]蛋白序列与翻译后修饰板块进行比对,有了这些信息我们便能轻松预测正确的WB条带位置了。
例如PD1蛋白,Mass(Da)显示其分子量约为31kDa,然而实际中PD1的WB阳性条带可能会出现在大于31kDa的位置(如下图)。造成这样差值的原因便可能为翻译后修饰如糖基化等。
5. 了解蛋白的分子水平信息后,我们还可以进一步查询其三级结构信息,分析与其他分子互作的结构域等。
例如PD1蛋白,可在下面的板块选择感兴趣的结构域进行分析,拖拽图片可观测蛋白三维构成。二级结构信息如螺旋(Helix)、转角(Turn)、β折叠(Beta strand)等也能在此板块中查询到。
02、The Human Protein Atlas数据库
做免疫组化(IHC)的老师注意了!接下来介绍的数据库,The Human Protein Atlas,内含近30000种人类蛋白质的组织和细胞分布信息,并提供免费查询。
瑞典Knut&Alice Wallenberg基金会利用免疫组化技术,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。
我们以胰岛素蛋白insulin为例,查询它的表达情况:
1. 浏览器中输入https://www.proteinatlas.org/进入查询页面,在搜索栏中输入目标蛋白的名称“insulin”。进入蛋白详细页面后,可在前端找到组织特异性(Tissue specificity),细胞特异性(Single cell type specificity),预测定位(predicted location),胞外定位(Extracellular location),蛋白功能(Protein function),蛋白参与的生物学过程(Biological process)等重要信息的简介。
2. 点击上方Tissue菜单栏,可进入蛋白质组织特异性的详细信息页面。这里可以找到蛋白质在不同组织中的表达情况,如insulin被发现仅仅只在胰腺中有较高的RNA与蛋白质表达水平。
点击右侧的免疫组化图片可查看各类细胞免疫组化验证结果,此图片可参考为免疫组化阳性对照图。
3. 点击上方Cell type菜单栏,可查询蛋白RNA在各种细胞中的表达水平,以及人类细胞系,小鼠细胞系中的定位。查看细胞定位荧光图时,可以通过点击需要显示的内容,如抗体,细胞核,微管等,选择单独显示或叠加显示荧光效果。
点击上方Cell RNA菜单栏可查看蛋白质RNA表达情况与定位。
4. 点击上方菜单栏中的pathology可进入到蛋白质的癌症相关研究,在这里可以查看不同肿瘤样品中蛋白的表达情况,该栏中数据整合了Atlas另一强大数据库,The Cancer Genome Atlas (TCGA),可查询各类肿瘤样本免疫组化图谱等。
利用如此强大的The Human Protein Atlas数据库,我们可以轻松查询在免疫组化或肿瘤免疫实验中目标蛋白的信息,帮助我们加速试验!
03、PhosphoSitePlus数据库
PhosphoSitePlus数据库是一个由 CST 和 NIH 联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些 CST 公司发现但未发表的蛋白修饰位点。
该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究 PTMs 在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。
在 PhosphoSitePlus数据库我们能够查询:
●一个蛋白质存在哪些翻译后修饰位点
● 与特定蛋白修饰相关的疾病、细胞系、组织类型
● 蛋白的亚细胞定位、修饰蛋白序列、基因序列、结构域等
● 在蛋白的空间水平上显示蛋白修饰位点的位置
● 及时更新的激酶底物和相关序列
1. 在浏览器中输入https://www.phosphosite.org/可进入PhosphoSitePlus数据库主页,在搜索栏中输入目标蛋白名称,点击search查询蛋白基本信息和磷酸化位点及功能。我们以蛋白激酶B (AKT) 为例进行接下来的展示。
蛋白可能发生的修饰类型总结在了‘MODIFICATION TYPE(S)’一栏中,相应的蛋白位点特异型及相关修饰的抗体产品通过点击后方CST图标可进行查询。
2. 点击红色的蛋白名称后进入详细页面,可根据自己需要勾选显示的蛋白修饰位点信息。在下面所示的位点统计表里,通过点击具体位点可进入详细页面,内含该位点在NCBI/SwissProt/PDB的序列信息以及引用文献。鼠标滚动可放大缩小位点统计表寻找目标位点。
勾选Somatic Cancer Mutations后图表中将显示各位点突变与各癌症的比例,同样方法可显示SNP的具体信息,鼠标悬浮在具体位点的红色小方块上以显示。
下方版块可查询蛋白基本信息、具体修饰位点信息(Site Table)、上下游位点信息(Upstream/Downstream)、该蛋白在不同癌症中的突变情况(Cancer)、不同物种中该蛋白修饰的保守性比较(Conservation)。
3. 点击位点表(Site Table)可显示如下页面,此页面中可查看蛋白在各位点的修饰情况,如S2-p是指第二位丝氨酸发生磷酸化修饰。通过LTP(低通量筛选,如氨基酸测序)和HTP(高通量筛选,如质谱法)这两种方法记录了相应修饰对应的参考文献(点击红色数字可查看)。
4. 想要了解各个修饰位点有什么影响或作用,可点击下游信息(Downstream)查看。其中包括各种修饰对该蛋白功能的影响,以及对生物学过程的影响。
5. 点击癌症信息(Cancer)可查看蛋白突变出现在各癌症中的比例。
6. 点击保守性(Conservation)可查看比较各种属蛋白序列的保守性比较。
至此,我们已学习了UniProt、The Human Protein Atlas、PhosphoSitePlus三个强大的蛋白数据库的用法。灵活运用这些数据库辅助工具,可以快速便捷地查询到我们在蛋白实验中需要的信息,例如蛋白的序列,结构,功能,修饰等,大大加速我们的实验。
后续,我们也会在微信视频号“优宁维抗体专家”上传相关的学习视频哦!喜欢的小伙伴一定不要错过!还有神秘福利等着你!