生物信息学_分子数据库（三）蛋白质数据库

最新推荐文章于 2024-08-28 12:08:30 发布

金石就好

最新推荐文章于 2024-08-28 12:08:30 发布

阅读量2.6k

点赞数

分类专栏：生物信息学文章标签：生物信息学数据库

本文链接：https://blog.csdn.net/Biohow/article/details/118544741

版权

蛋白质的空间结构是其行使功能的基础，所以蛋白质既有序列数据库还有结构数据库。

蛋白质序列数据库

蛋白质序列数据库有很多，如SwissProt，TrEMBL，Pir等。

Pir是世界上第一个具有分类和功能注释的蛋白质序列数据库。

SwissProt包括了从EMBL翻译而来的蛋白质序列，经过人工校验和注释，冗余度较小。

为了解决人工注释较慢的问题，建立了由计算机注释的TrEMBL数据库，该数据库序列由EMBL中核酸序列翻译而来，其中剔除了包含在SwissProt数据库中的蛋白质序列。

UniProt数据库

整合了SwissProt，TrEMBL，Pir三家数据库的资源构建了通用蛋白质数据库。

UniProt分为三层：

UniParc

由于蛋白质序列冗余，将序列相同的合并为一条，为每条序列提供唯一的编号。

UniRef

为了加快检索速度，将UniParc中的序列根据一定的条件进行分类并去除冗余。

UniProtKB

分为UniRef/TrEMBL和UniRef/SwissProt两部分，为其提供序列的详细信息。

蛋白质结构数据库

蛋白质空间结构

一级：组成蛋白质的氨基酸序列。

二级：由氨基酸序列在空间构成的有规律的结构，一般依靠氢键，疏水键等非共价键维持空间结构，如α螺旋，β折叠。

结构域：介于二级和三

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

金石就好

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

生信自学笔记（三）分子数据库

羊城迷鹿的博客

07-27

4875

分类基因组数据库：GDB、GenBank、Ensembl 核酸数据库：ENA（EMBL）、GenBank、DDBJ 蛋白质数据库：SWISS-PROF、PIR、PDB 一个数据库记录由两部分组成：原始序列数据和描述这些数据生物学信息的注释。记录格式 FASTA 在生物信息学中，FASTA 格式是一种用于记录核酸序列或肽序列的文本格式，其中的核酸或氨基酸均以单...

AI4S - 生物领域知名 AI 制药公司简析

AGI

04-11

4655

目前，AI 制药主要关注的药物研发领域，即小分子(Small Molecule)、大分子(Large Molecule)、酶(Enzyme)、细胞与基因治疗(CGT, Cell and Gene Therapy)、从头设计蛋白质(De Novo Protein)、靶点发现(Target Discovery)。

参与评论您还未登录，请先登录后发表或查看评论

生物蛋白质数据库类型【总结】

weixin_46578305的博客

04-01

7587

蛋白质数据库 蛋白质数据库的类型有：UniProtKB、PDB、Pfam、CATH、SCOP2、KEGG、OMIM。 UniProtKB 属于一级蛋白质数据库。网址为： http://www.uniprot.org/ 其三个层次数据库： UniPrac：收录所有UniProt数据库子库的蛋白质序列，数量大。 UniRef：归纳UniProt几个主要数据库并重复系列去除后的数据库。 UniP...

分子数据查询

sinat_39897848的博客

06-26

928

网址: https://www.nist.gov/pml/atomic-spectra-database。- 网址: https://home.strw.leidenuniv.nl/moldata/- 网址: https://cdms.astro.uni-koeln.de/classic/- 这个是专门针对天体物理研究的分子数据库,包含了许多分子的能级、跃迁概率等信息。- 这个数据库由美国喷气推进实验室维护,包含了大量分子的光谱参数。- 网址: https://spec.jpl.nasa.gov/

生物信息学_分子数据库（四）其他数据库

金石就好的博客

07-08

491

生物数据库除核酸和蛋白质还有一些专用数据库。当你明确研究对象，应尽可能多的寻找并阅读相关文献。文献数据库 PubMed数据库 Pubmed是互联网最著名的免费Medline数据库，由NLM的生物信息技术中心（NCBI）提供。 pubmed数据源： MEDLINE indexed：主体、标有主题词（MeSH，medical subject headings，医学主题词）、文献类型等字段。 OldMEDLINE：1950-1965年间的美国医学索引（IM）中的题录（无文摘），约200万篇，逐渐并入MED

全球蛋白质及基因组经典数据库汇总

最新发布

Fumingouge的博客

08-28

1543

全球蛋白质及基因组数据库集锦

生物信息学_分子数据库（一）分子数据库概述

金石就好的博客

07-04

1788

为什么需要分子数据库？ 数据库记录包括两部分： 1.原始序列数据 2.描述原始数据的生物学信息的注释随着研究的积累，生物信息数据越来越多，且在研究中，如果仅仅知道数据的来源而对其他方面知之甚少，研究也会变得极为困难。所以为了研究的便利，能够对数据进行存储共享和使用，所以分子数据库应运而生。分子数据库 数据库数量多 数据库种类复杂数据量巨大且不断增长数据间关系复杂数据存在冗余和偏差版本不断更新提供开源web服务分子数据库种类繁多，但是主要可以分为三大类： 1.核酸数据库 2.蛋白质数据库

生物信息学_分子数据库（二）核酸

金石就好的博客

07-05

2085

核酸序列数据库主要包括了基因组DNA序列，mRNA序列，tRNA序列，rRNA序列等核酸序列。国家上有三个主要核苷酸序列公共数据库：位于英国剑桥的欧洲分子生物学实验室的欧洲核苷酸档案库（ENA）位于美国的生物技术信息中心的GeneBank数据库位于日本的DNA数据库（DDBJ）分别收集来自不同地区的数据，三大数据库进行数据共享且向世界开放。核酸序列数据增长迅速，所以数据库版本更新较快，进行生物信息学分析时，务必注明数据库的数据状况及时间。为维持数据的原始性，未经原作者允许，不能对原始数据库

山东大学生物信息学课件03生物信息学数据库及检索策略.pptx

11-12

生物信息学数据库可以分为三类：基因数据库、蛋白质数据库和蛋白质结构数据库。基因数据库用于存储基因序列和基因功能信息，蛋白质数据库用于存储蛋白质序列和蛋白质功能信息，蛋白质结构数据库用于存储蛋白质结构...

如何使用分子信息数据库

10-17

详细描述分子信息的数据库，以及该数据库的使用及优点。

MINT:蛋白质相互作用数据库简介

庐州月光的博客

11-06

5489

欢迎关注微信公众号《生信修炼手册》! MINT, 全称molecular interaction Database, 是一个蛋白质相互作用的数据库，该数据库中的蛋白相互作用都是由专家审核过的有实验证据支持的，目前该数据库涵盖了607个物种，共117001个蛋白相互作用关系。网址如下 https://mint.bio.uniroma2.it/ 目前该数据库中的数据已经集成到intact这个数据库...

蛋白质CC结构域Marcoil

08-03

linux 安装报错iostream.h fstream.h No such file or directory 解决安装问题

生信 蛋白质结构与功能确定【思维导图】（学习总结）

weixin_46839673的博客

05-08

4721

这个是根据老师上课的内容所做的笔记，大家可以参考的看一下。上面部分是大纲，下面是所有的思维导图。 蛋白质结构与功能确定 蛋白质数据库 PIR （protein informaon resources）【PSD】来自于Genbank，EMBL,DDBJ 会导致数据库权威性不够，因为这三个数据库为核酸数据库，结果为预测，不够准确从发表的文章得到的序列提交得到的序列 SWISS-PROT/TrEMBL 记录格式特征e.g.P12544 Protein sequences databases PROSITE

根据ProteinID，去掉.faa文件中冗余的protein序列，并记录organism于蛋白名称中

weixin_48409429的博客

10-21

1578

目的如题。准备：Allwp.faa保存于D:\PyCharm\py_code\test 将以下代码写入MoveRedundancy.py中，并分段运行创建文件夹D:\PyCharm\py_code\test\AllWP 备注：NCBI中不同的Organism可能含有相同的蛋白。Allwp.faa包含冗余蛋白序列，中蛋白名称的格式为：organism1(ProteinID1), organism2(ProteinID2)。欲对Allwp.faa去...

PDB文件格式说明查看方式记录

weixin_42038527的博客

02-02

959

对于研究蛋白质性质的课题，都需要明确知道物质结构信息而非简单的序列信息。

【生信】初探蛋白质性质和结构分析

池塘春草梦的博客

12-31

8630

对蛋白质的一级、二级和三级结构进行分析和预测、蛋白质的跨膜结构、翻译后修饰、亚细胞定位等进行分析和预测

管理与使用PDB表空间

wuwndj的博客

09-18

1152

一、管理与使用PDB表空间 1.1补充知识————数据库容器（CDB）与可插拔数据库（PDB）容器数据库CDB和可插拔数据库PDB是Oracle 12c的新特性。在CDB中最高层container被称为CDB￥ROOT；用来创建其他PDB的模板PDB被称为PDB￥SEED；CDB中可以用PDB$SEED创建多个PDB。关系说明： 1）CDB与ROOT之间的关系为一对一； 2）SEED之间的关系也是一对一。 3）用户在PDB中可以找到在CDB中找不到的用户。扩充知识： 1.CDB和每个PDB都有各自的S

oracle查看pdb表空间,管理与使用PDB的表空间

weixin_34982065的博客

04-07

3555

1、进入PDB，打开PDB，显示连接名称SQL> alter session set container=orclpdb;Session altered.SQL> show con_name;CON_NAME------------------------------ORCLPDB2、查看PDB中对象的名称SQL> select name,open_mode from v$pdb...

常用生物数据库

CBB_FT的博客

04-29

8585

1、蛋白质 蛋白质（Protein）是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。一般说，蛋白质约占人体全部质量的18%，最重要的还是其与生命现象有关。 蛋白质是生命的物质基础，是有机大分子，是构成细胞的基本有机物，是生命活动的主要承担者。氨基酸是蛋白质的基本组成单位。它是与生命及与各种形式的生命活动紧密联系在一起的物质。机体中的每一个细胞和所有重要组成部分都有蛋白质参与。蛋白质占人体重量的16%-20%，即一个60kg重的成年人其体内约有蛋白质9.6-12kg。人

探索生物信息学：单细胞数据库及其应用

生物信息学是研究生物数据的科学，特别是在分子水平上对生物大分子、基因组、蛋白质组、代谢组等生物信息的采集、处理、存储、分析、解释和传播。其中，单细胞测序技术是近年来生物信息学领域的一项革命性进步，它...