前言
本次Pymol
演示涉及到的蛋白质有PUB ID
为7DHG
和5T01
,已经下好PDB
格式文件。
推荐视频:https://www.bilibili.com/video/BV1JM4feoETS/
,该视频讲解了蛋白质结构的显示方式。
加载蛋白质
打开PyMol,页面长这样
直接把下载好的pdb
格式的文件,拖拽到页面上就呈现如下。
蓝绿色代表氨基酸,红色代表水。
有时候如果蛋白质整个呈灰色,类似如下:
就选择Setting
/Rendering
,取消勾选OpenGL 2.0 Shaders
显示氨基酸序列
在PyMol
的工具层,选择Display/Sequence
,此时页面最上方就出现一连串氨基酸序列
最前面的/7dhg/
是这个蛋白的PDB ID
,然后就是一连串氨基酸序列,我们通常遍历一遍。
氨基酸残基或原子缺失(UCSF Chimera)
当我们在氨基酸序列中看到了类似---...---
的部分时,这通常表示该位置的氨基酸残基缺失或者未被指定。我们需要使用UCSF Chimera
工具去补全。
核苷酸
同时,如果我们看到这里的氨基酸序列里有一些DC DT DC
一样的东西,其实这些是DNA核苷酸。在这里我将另一个蛋白5t01
的氨基酸序列截图如下:
我们打开的fasta
格式的文件可以更清楚地看见这一点(下文中有讲到fasta
文件)
可以看到最后两条链都是ATGC
。
(其实看结构也能看得出来,黄色的就是DNA双螺旋结构。
带正电的氨基酸
如果一些氨基酸序列中有紫色的字母,那么这个代表着带正电的氨基酸,一般不需要去除。
添加分子伴侣/重要离子/小分子
对于有些蛋白,譬如血红蛋白,如果能先螯合二价铁离子,是有利于后续分子对接的。
去除水
下文操作仅展示基础操作,实际上进阶操作是需要先查阅文献或者相关数据库,譬如PDB数据库,区分一下保守水分子和结晶水分子。一般我们要去除的是结晶水分子,而保留保守水分子。
当我们遍历到氨基酸序列的最右边,可以看到有很多数字0
,这个也代表水。
在pymol
的最右侧,有五个简写字母:
- A(ction) 是进行一些操作
- S(how) 是可视化的一些设置
- H(ide) 是隐藏一些可视化的设置,和S是对应的
- L(able) 是打标签
- C(olor) 是上色
点击A
字母后可以看到有remove waters
的选项,即“去除水”
此时再看界面就会发现没有红色的小点了,也就是没有水了
同时,可以看到氨基酸序列的代表水的数字0
不见了
去除配体
我们点击A
,找到present/publication(with solver)
页面就变成了如下:
这主要是方便看是否有残存的配体。
此时氨基酸序列也会逐渐变色,配体的颜色就显得比较突兀,如下IOK
就是一个配体,需要去除(不是该蛋白的序列,仅拿来演示):
调整背景颜色
我们可以在设置中调整背景颜色
保存PDB/mol
文件或者图像
命令保存文件
在PyMol
自带的终端里面输入:
save 文件名.pdb
即可保存,mol
文件同理
设置保存文件或图像
可以通过save
设置保存。文件名不需要加上.pdb
。本人一般都输入蛋白质PDB ID_pymoled
,譬如这里的7dhg_pymoled
命令行
我们可以看到pymol
有自带的命令行终端。
输入cmd.do("reset")
会重置当前的会话,包括所有的视图和加载的分子。
同时也有正常cmd
有的ls
、cd
等命令,且可以tab
补充,但是没有提供清空终端的命令(属实愚蠢
查看蛋白结构有几条链
这里还要介绍如何查看一个蛋白的结构有几条链。请注意,我们的演示蛋白换成了5t01
。
氨基酸序列观察
你可以直接通过氨基酸序列进行观察,如下(我已经完成去水和去配体的操作):
那么这里就可以看到,/A/
、/B/
、/C/
、/D/
,那么一共是有四条链的。
get_chains查看
也可以通过命令行查看
get_chains
可以看到,它有四条链。
导出成fasta格式观察
或者我们直接给他导出成fasta
格式的文件,在命令行输入
save 5t01.fasta, 5t01
如下:
这里逗号后面的5t01
主要是看氨基酸序列最开始是什么
可以看到/5t01/
,所以是5t01
导出的fasta
格式文件用文本编辑器打开,如下:
也可以看到是有四条链的,同时可以更清楚地看到蛋白质内部的序列。譬如最后一条链我们可以看到有一个?
,代表着缺失。