生物蛋白质数据库类型【总结】

蛋白质数据库

蛋白质数据库的类型有:UniProtKB、PDB、Pfam、CATH、SCOP2、KEGG、OMIM。

UniProtKB

属于一级蛋白质数据库。网址为:

http://www.uniprot.org/

在这里插入图片描述
其三个层次数据库:

  1. UniPrac:收录所有UniProt数据库子库的蛋白质序列,数量大。
  2. UniRef:归纳UniProt几个主要数据库并重复系列去除后的数据库。
  3. UniProtKB: 详细注释并与其他数据库有链接的数据库,又分为UniProtKB、Swiss-Prot和UniProtKB、TrEMBL。其中Swiss-Prot中的数据是实验所得,经过人工检查后的完成的注释,而TrEMBL是自动完成的注释。
使用方法:

搜寻所要查找的蛋白质,会出现如下图所示:

在这里插入图片描述在注释标签当中有很多列,包括功能、名称、蛋白质亚细胞定位信息、翻译后修饰/加工信息、基因在mRNA水平上的表达信息、蛋白质互作的信息、蛋白质二级/三级结构信息(只有经过实验测验后)、蛋白质家族和结构域信息、蛋白质序列、相关文献等。

PDB

属于一级蛋白质结构数据库。网址为:

http://www.rcsb.org/

在这里插入图片描述搜索部分显示有关蛋白质的基本信息,如果要看其他信息则下载PDB format的一个.pdb文件,文件可用记事本打开,文件当中包括:分子类别、关键词、测定结构采用的方法、一级结构信息、氨基酸序列、对标准残基的修饰、二级结构、残基间的化学键、3D坐标(原子坐标)、原子键信息等。

Pfam

属于二级蛋白质数据库,蛋白质结构家族的集合。网址为:

http://pfam.xfam.org/

CATH

属于二级蛋白质结构库。网址为:

http://cathdb.info/

CATH名字分别是数据库中四种结构的分类层次的首字母,即蛋白质种类(class,C),蛋白质二级结构的构架(architecture,A),蛋白质的拓扑结构(topology[fold],T),蛋白质同源超家族(homologous superfamily,H)。

SCOP2

属于二级蛋白质结构数据库。
SCOP2分类基于四个层次:类(二级结构成分)、家族(空间几何关系)、超家族(远源的蛋白质进化关系)和折叠(相近的蛋白质进化关系)。

KEGG

属于一个专用数据库,关于基因、蛋白质、生化反应以及通路的综合生物信息数据库,可提供方方面面的信息。

生物总代谢的信息图在这里插入图片描述KO:蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,打上KO的标签。

OMIM

专用数据库,提供遗传疾病及相关基因位点的信息。网址为:

http://www.ncbi.nlm.nih.gov/omim

  • 2
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值