网络药理学：9、分子对接前置处理：pymol（显示氨基酸序列、去水、去离子、调整背景、保存PDB/mol/png文件）与常用操作（命令行相关、查看蛋白链数）、UCSF Chimera补全氨基酸残基

shanshandeisu

已于 2024-10-01 21:55:42 修改

阅读量4.2k

点赞数 24

分类专栏：中药网络药理学文章标签：网络药理学 pymol 分子对接 AutoDock PyMol PDB 生物信息学

于 2024-08-07 22:00:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhiaidaidai/article/details/141001971

版权

中药网络药理学专栏收录该内容

31 篇文章

订阅专栏

前言

本次Pymol演示涉及到的蛋白质有PUB ID为7DHG和5T01，已经下好PDB格式文件。

推荐视频：https://www.bilibili.com/video/BV1JM4feoETS/，该视频讲解了蛋白质结构的显示方式。
在这里插入图片描述

加载蛋白质

打开PyMol，页面长这样
在这里插入图片描述
直接把下载好的pdb格式的文件，拖拽到页面上就呈现如下。

蓝绿色代表氨基酸，红色代表水。

有时候如果蛋白质整个呈灰色，类似如下：
在这里插入图片描述
就选择Setting/Rendering，取消勾选OpenGL 2.0 Shaders

显示氨基酸序列

在PyMol的工具层，选择Display/Sequence，此时页面最上方就出现一连串氨基酸序列
在这里插入图片描述
最前面的/7dhg/是这个蛋白的PDB ID，然后就是一连串氨基酸序列，我们通常遍历一遍。

氨基酸残基或原子缺失（UCSF Chimera）

当我们在氨基酸序列中看到了类似---...---的部分时，这通常表示该位置的氨基酸残基缺失或者未被指定。我们需要使用UCSF Chimera工具去补全。
在这里插入图片描述

核苷酸

同时，如果我们看到这里的氨基酸序列里有一些DC DT DC一样的东西，其实这些是DNA核苷酸。在这里我将另一个蛋白5t01的氨基酸序列截图如下：
在这里插入图片描述
我们打开的fasta格式的文件可以更清楚地看见这一点（下文中有讲到fasta文件）

可以看到最后两条链都是ATGC。

（其实看结构也能看得出来，黄色的就是DNA双螺旋结构。

带正电的氨基酸

在这里插入图片描述
如果一些氨基酸序列中有紫色的字母，那么这个代表着带正电的氨基酸，一般不需要去除。

添加分子伴侣/重要离子/小分子

对于有些蛋白，譬如血红蛋白，如果能先螯合二价铁离子，是有利于后续分子对接的。

去除水

下文操作仅展示基础操作，实际上进阶操作是需要先查阅文献或者相关数据库，譬如PDB数据库，区分一下保守水分子和结晶水分子。一般我们要去除的是结晶水分子，而保留保守水分子。

当我们遍历到氨基酸序列的最右边，可以看到有很多数字0，这个也代表水。
在这里插入图片描述

在pymol的最右侧，有五个简写字母：

A(ction) 是进行一些操作
S(how) 是可视化的一些设置
H(ide) 是隐藏一些可视化的设置，和S是对应的
L(able) 是打标签
C(olor) 是上色

点击A字母后可以看到有remove waters的选项，即“去除水”

此时再看界面就会发现没有红色的小点了，也就是没有水了

同时，可以看到氨基酸序列的代表水的数字0不见了

去除配体

我们点击A，找到present/publication（with solver）
在这里插入图片描述
页面就变成了如下：

这主要是方便看是否有残存的配体。
此时氨基酸序列也会逐渐变色，配体的颜色就显得比较突兀，如下IOK就是一个配体，需要去除（不是该蛋白的序列，仅拿来演示）：

调整背景颜色

我们可以在设置中调整背景颜色
在这里插入图片描述

保存`PDB/mol`文件或者图像

命令保存文件

在PyMol自带的终端里面输入：
save 文件名.pdb
即可保存，mol文件同理

设置保存文件或图像

可以通过save设置保存。文件名不需要加上.pdb。本人一般都输入蛋白质PDB ID_pymoled，譬如这里的7dhg_pymoled
在这里插入图片描述

命令行

我们可以看到pymol有自带的命令行终端。
输入cmd.do("reset")会重置当前的会话，包括所有的视图和加载的分子。
同时也有正常cmd有的ls、cd等命令，且可以tab补充，但是没有提供清空终端的命令（属实愚蠢

查看蛋白结构有几条链

这里还要介绍如何查看一个蛋白的结构有几条链。请注意，我们的演示蛋白换成了5t01。

氨基酸序列观察

你可以直接通过氨基酸序列进行观察，如下（我已经完成去水和去配体的操作）：
在这里插入图片描述

那么这里就可以看到，/A/、/B/、/C/、/D/，那么一共是有四条链的。

get_chains查看

也可以通过命令行查看

get_chains

在这里插入图片描述
可以看到，它有四条链。

导出成fasta格式观察

或者我们直接给他导出成fasta格式的文件，在命令行输入

save 5t01.fasta, 5t01

如下：
在这里插入图片描述
这里逗号后面的5t01主要是看氨基酸序列最开始是什么

可以看到/5t01/，所以是5t01

导出的fasta格式文件用文本编辑器打开，如下：
在这里插入图片描述
也可以看到是有四条链的，同时可以更清楚地看到蛋白质内部的序列。譬如最后一条链我们可以看到有一个?，代表着缺失。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shanshandeisu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。