蛋白质结构预测---残基接触的基础知识(二)

接下来我会用一条PDBID为1F88的蛋白质为例子,来解释什么叫蛋白质接触矩阵。

一、PDB数据库

Protein Data Bank(以下简称,PDB,https://www1.rcsb.org/)是当今全世界最具公信力的蛋白质数据库之一,每一条蛋白质都有唯一标识,称为PDBID(类似每个人都有自己的身份证号,唯一标识),比如PDBID为1F88的蛋白质在PDB中如下:
在这里插入图片描述

二、蛋白质的1级结构—序列

蛋白质的1级结构指的是其序列。在PDB中可以下到蛋白质的序列文件,如1F88的序列文件rcsb_pdb_1F88.fasta如下:
第一行记录了该蛋白的信息
第二行开始记录了该条蛋白质的序列,由一个个氨基酸构成。以这个1F88为例,序列中包含了348个氨基酸,说明1F88由348个氨基酸构成,所以1F88的长度为348。
在这里插入图片描述我再贴一下氨基酸的缩写表,上图中的每一个字母,对应着下面的其中一个氨基酸。
在这里插入图片描述

三、蛋白质的3级结构—空间结构

2级结构我不关心,这里不做阐述。蛋白质的3级结构即空间结构。空间结构中包含了接触信息。那么蛋白质的3级结构如何获得?表示?怎么解读呢?一部部来。

3.1 蛋白质3级结构是什么?

3级结构就是空间结构。空间中每一个氨基酸集团由若干个原子构成。每一个原子都会有自己的唯一确定的三维坐标由(x,y,z)表示。

3.2 蛋白质3级结构如何表示?

以1F88蛋白质为例,1F88的3级结构用文件1F88.pdb来描述。该文件可以在PDB中下载到如下:
在这里插入图片描述1F88.pdb文件打开后,文件的前半部分有大量的序列信息,我们不关心,我们只关心他的3维结构信息,从第一行为 ATOM开头的行开始,就是记录了坐标信息如下:

红框中表示MET(在一级序列中,简称M)氨基酸由编号1~9个原子构成,第三列为每一个原子的名称(共9个,分别为N原子、CA原子、C原子、O原子、CB原子、CG原子、SD原子、CE原子、N原子)
蓝框中的三列分别对应了三维坐标中的x,y,z。如CA原子的三维坐标为(44.718,-5.054,-26.911)
在这里插入图片描述

3.3 蛋白质3级结构信息如何解读?

在知道了每个原子的三维坐标后,我们可以在坐标系中,把每一个原子都标记出来,这样就得到了蛋白质的三维结构的空间图,如1F88序列经过PDB文件的坐标解析后,用Pymol软件打开可以看到他的结构如下:
在这里插入图片描述

四、小结

本节介绍了一些蛋白质三维结构的基本概念,弄清楚三维结构的概念后,接下来要介绍接触的概念。
Ending~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

clhappyjiang

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值