【生物信息学学习】第二天：二级核酸数据库

最新推荐文章于 2024-04-10 14:39:10 发布

Ginno

最新推荐文章于 2024-04-10 14:39:10 发布

阅读量560

点赞数

文章标签：数据库学习 oracle

本文链接：https://blog.csdn.net/weixin_45685859/article/details/132775527

版权

【生物信息学学习】第二天：蛋白质数据库

一级蛋白质数据库
二级蛋白质数据库（未完善）

本文内容均来自山东大学生物信息学课程

一级蛋白质数据库

蛋白质序列数据库

swissprot
swissprot是一个人工注释的蛋白质序列数据库，具有注释可信度高，冗余度小的优点。由欧洲生物信息学研究所与瑞士生物信息学研究所共同管理。

TrEMBL
TrEMBL：蛋白质序列数据库是计算机完成的，包括蛋白质编码的所有翻译产物，可惜可信度低且冗余度大。

PIR
蛋白质信息资源数据库（PIR）设立在美国乔治城大学医学中心，是一个支持基因组学，蛋白质组学和系统生物学研究的综合公共生物信息学资源。

UniProt

UniProt数据库: http://www.uniprot.org/

UniProt具有三个层次数据库：
1、UniParc：收录所有UniProt数据库子库中的蛋白质序列，量大，粗糙。
2、UniRef：归纳UniProt几个主要数据库并将重复序列剔除后的数据库。
3、 UniProtKB：有详细注释并与其他数据库有链接的数据库，分为UniProtKb/Swiss-Prot和UniProtKB/TrEMbL。其中我们最常用的是Swiss-Prot数据库。

昨天我们一直通过dUTPase进行学习，我们今天继续使用dUTPase来进行检索

在检索框内输入human dUTPase，出现以下界面：

在这里插入图片描述

我们可以从中发现很多条蛋白质序列，从名字中可以看到，第一条应该是我们需要的检索结果。

通过左侧黄色加星图标，我们可以了解到该序列是否被人工检查过

点击进入，我们可以得知该蛋白质的详细信息。

Swiss-Prot相关注释解读

Function：提供与蛋白质功能相关的信息

在这里插入图片描述

Names & Taxonomy：蛋白质的名字，所属物种的分类学信息等基本信息

在这里插入图片描述

Subcellular Location：提供蛋白质亚细胞定位的信息（重要）
亚细胞定位：蛋白质在细胞内不同组分中的定位，对蛋白质的生理功能有着直接的影响。

在这里插入图片描述

成熟的蛋白质需要在特定的细胞部位才能发挥其生物学功能。
目前研究亚细胞定位的数据来源基本都来源于Swiss-Prot数据库。

通过昨天的学习，我们了解了dUT基因具有两种剪切方式，其中一种会保留前端端一段信号肽。信号肽将蛋白质定位于线粒体，而没有信号肽的蛋白质则留在了细胞核。

mRNA            join(<282..561,1034..1172,2395..2486,3113..3157,
                     4447..4521,4673..4743,5180..>5236)
                     /gene="DUT"
                     /product="dUTPase"
                     /note="alternatively spliced; encodes mitochondrial form
                     of the protein"

 mRNA            join(<1018..1172,2395..2486,3113..3157,4447..4521,
                     4673..4743,5180..>5236)
                     /gene="DUT"
                     /product="dUTPase"
                     /note="alternatively spliced; encodes nuclear form of the
                     protein"