【生物信息学学习】第二天:二级核酸数据库

本文内容均来自山东大学生物信息学课程

一级蛋白质数据库

蛋白质序列数据库

swissprot
swissprot是一个人工注释的蛋白质序列数据库,具有注释可信度高,冗余度小的优点。由欧洲生物信息学研究所与瑞士生物信息学研究所共同管理。

TrEMBL
TrEMBL:蛋白质序列数据库是计算机完成的,包括蛋白质编码的所有翻译产物,可惜可信度低且冗余度大。

PIR
蛋白质信息资源数据库(PIR)设立在美国乔治城大学医学中心,是一个支持基因组学,蛋白质组学和系统生物学研究的综合公共生物信息学资源。

UniProt

UniProt数据库: http://www.uniprot.org/

UniProt具有三个层次数据库:
1、UniParc:收录所有UniProt数据库子库中的蛋白质序列,量大,粗糙。
2、UniRef:归纳UniProt几个主要数据库并将重复序列剔除后的数据库。
3、 UniProtKB:有详细注释并与其他数据库有链接的数据库,分为UniProtKb/Swiss-Prot和UniProtKB/TrEMbL。其中我们最常用的是Swiss-Prot数据库。

昨天我们一直通过dUTPase进行学习,我们今天继续使用dUTPase来进行检索

在检索框内输入human dUTPase,出现以下界面:

在这里插入图片描述

我们可以从中发现很多条蛋白质序列,从名字中可以看到,第一条应该是我们需要的检索结果。

通过左侧黄色加星图标,我们可以了解到该序列是否被人工检查过

点击进入,我们可以得知该蛋白质的详细信息。

Swiss-Prot相关注释解读

Function:提供与蛋白质功能相关的信息

在这里插入图片描述

Names & Taxonomy:蛋白质的名字,所属物种的分类学信息等基本信息

在这里插入图片描述

Subcellular Location:提供蛋白质亚细胞定位的信息(重要)
亚细胞定位:蛋白质在细胞内不同组分中的定位,对蛋白质的生理功能有着直接的影响。

在这里插入图片描述

成熟的蛋白质需要在特定的细胞部位才能发挥其生物学功能。
目前研究亚细胞定位的数据来源基本都来源于Swiss-Prot数据库。

通过昨天的学习,我们了解了dUT基因具有两种剪切方式,其中一种会保留前端端一段信号肽。信号肽将蛋白质定位于线粒体,而没有信号肽的蛋白质则留在了细胞核

mRNA            join(<282..561,1034..1172,2395..2486,3113..3157,
                     4447..4521,4673..4743,5180..>5236)
                     /gene="DUT"
                     /product="dUTPase"
                     /note="alternatively spliced; encodes mitochondrial form
                     of the protein"

 mRNA            join(<1018..1172,2395..2486,3113..3157,4447..4521,
                     4673..4743,5180..>5236)
                     /gene="DUT"
                     /product="dUTPase"
                     /note="alternatively spliced; encodes nuclear form of the
                     protein"

Disease & Variants:提供蛋白质突变或缺失导致的疾病及表型信息

在这里插入图片描述

PTM/Processing:提供蛋白质翻译后修饰或翻译后加工的相关信息

在这里插入图片描述

Expression:提供了基因在mRNA水平上的表达信息,或者在细胞中蛋白质水平上的表达信息,或者在不同器官组织中的表达信息。

在这里插入图片描述

Interaction:提供了蛋白质之间相互作用的信息

在这里插入图片描述

Structure:提供蛋白质二级结构和三级结构的信息

在这里插入图片描述

Family & Domains:提供蛋白质家族及结构域信息

在这里插入图片描述

Sequence:提供蛋白质氨基酸序列信息。多个isoform(亚型)会显示多条序列。

在这里插入图片描述

蛋白质结构数据库(PDB)(未完善)

蛋白质结构可以分为四级:
1、一级结构:氨基酸序列
2、二级结构:周期性的结构现象
3、三级结构:整条多肽链的三位空间结构
4、四级结构:几个蛋白质分子(亚基)形成的复合体

蛋白质结构数据库(PDB)是全世界唯一存储生物大分子3D结构的数据库。这些生物大分子除了蛋白质以外还包括核酸及两者的复合物。只有通过试验方法获得的3D结构才会被收入其中。

PDB数据库: http://www.rcsb.org/

二级蛋白质数据库(未完善)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值