一文蛋白功能结构域 预测与分析
1.蛋白结构域分析的原理
生物体的基因组决定了所有构成该生物体的蛋白质,基因规定了蛋白质的氨基酸序列。蛋白结构域是蛋白中具有特异空间结构和独立功能的区域,是蛋白质发挥生物学效用的关键功能单位。了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重要的。
对于所要研究的新基因,如何预测蛋白功能域呢?可以通过以下两种方式:
(1)比较未知蛋白序列与已知蛋白质序列的相似性。
(2)查找未知蛋白中是否包含与特定蛋白质家族或功能域有关的亚序列或保守区段。
2.蛋白结构域分析的方法
2.1 CD search
CD-Search基于一个简单的原理:具有相同或相近功能的基因往往具有相同的保守结构域。
CD-Search工具来可以鉴定蛋白质或者核酸序列内的保守结构域或功能单位。该工具位于NCBI中。具体我们可以进入NCBI后选择Conserved Domain然后点击Search
CDD入口:https://www.ncbi.nlm.nih.gov/cdd/,也可以从NCBI主页选项口选择进入Conserved Domain,然后输入蛋白名,点击Search
2.2 Pfam 蛋白结构域数据库
Pfam是一个蛋白家族及 功能域的数据库,而不是蛋白质本身的数据库,这个数据库包括蛋白家族的注释 和由隐马尔科夫模型建立的、具有相同注释结果的所有序列的多序列比对结果。Pfam 与其他蛋白相关的数据库的不同之处在于,它以蛋白质的功能域 或者是蛋白家族作为分类检索的标准。
Pfam 数据库链接:https://pfam.xfam.org/
使用步骤:
(1)在Uniport数据库查询UniProt KB号
点击Uniprot数据库链接https://www.uniprot.org/uniprotkb/,然后输入你所研究的蛋白名,如DNAH1:
在结果页会出现UniProt KB号,也就是E9Q8T7
(2)Pfam 数据库查询结构域:
详细步骤为 点击Pfam 数据库https://pfam.xfam.org/,然后输入UniProt KB号进行查询
如下图:
(3)结果解读与绘制
可以点击和下载蛋白所有的结构域,如下图所示:
绘制可以直接用该结果,或采用PPT形式绘制,也可以用一些绘图软件来完成。
2.3 SMART 蛋白结构域数据库
SMART (Simple Modular Architecture Research Tool) 是一个用于蛋白质结构域鉴定、注释的在线分析工具。它的数据与UniProt、Ensembl和STRING数据库同步,且人工注释的蛋白结构域超过1300个。
SMART数据库入口:http://smart.embl-heidelberg.de/
检索页面包含如下结果:
(1)结构域可视化:
(2)结构域起始位置和可信度
注:该数据库有以下两种模式 normal 或者 genomic
normal模式下包含了所有uniprot, ensembl的蛋白质信息,这些蛋白序列是存在冗余的,genomic模式下只包含了拥有完整蛋白质组的物种的信息。两种模式可以通过SETUP菜单进行切换,如下图:
(3)蛋白互作信息:
(4)信号通路信息:
2.4 Interpro-蛋白结构域数据库
InterPro是集成的蛋白质结构域和功能位点数据库,包含关于蛋白质家族、域、重复序列、和作用位点等数据资源,同时,InterPro也包含很多来自不同数据库的诊断签名的人工注释文件,形成了一个给定的蛋白质家族、结构域和功能位点的独特描述。
Interpro数据库成员包括Coils 、Gene3D、Pfam、PRINTS、ProSitePatterns、ProSiteProfiles、SMART、SUPERFAMILY、 TIGRFAM、ProDom、PIR 数据库,每两个月更新一次,是非常好用的蛋白序列功能注释数据库。
Interpro数据库链接:http://www.ebi.ac.uk/interpro/
主页如下:
使用方法:
1.点击search,可以选择蛋白质序列、文本-蛋白ID等提交、或结构域
按结构域查找:点击Add Domain to include按钮,填写结构域Pfam ID,即可查询Pfam数据库中含该结构域的蛋白,并且还可以通过点击Add Domain to exclude按钮,添加不包含某结构域条件进行快速筛选。
2.结果查看:
(1)提交任务后会持续运行,直至完成
(2)完成后,会返回结果页面:
会结合多个数据库给出蛋白结构域分析结果:
GO分析:
GO分析显示:该蛋白涉及微管加工过程,具有GTP水解功能,组成细胞骨架功能,是微管的成分,符合预期
3. 蛋白结构域分析的绘制和结果可视化应用
3.1 结果绘制
参考序列起始位点手动绘制,可以自行调整,借助软件来美化
3.2 结果可视化及应用
1.用于标记突变位点对蛋白保守区段的影响
2.用于辅助蛋白互作的研究
3.用于对蛋白功能的探究