网络药理学:9、分子对接前置处理:pymol(显示氨基酸序列、去水、去离子、调整背景、保存PDB/mol/png文件)与常用操作(命令行相关、查看蛋白链数)、UCSF Chimera补全氨基酸残基

前言

本次Pymol演示涉及到的蛋白质有PUB ID7DHG5T01,已经下好PDB格式文件。

推荐视频:https://www.bilibili.com/video/BV1JM4feoETS/,该视频讲解了蛋白质结构的显示方式。
在这里插入图片描述

加载蛋白质

打开PyMol,页面长这样
在这里插入图片描述
直接把下载好的pdb格式的文件,拖拽到页面上就呈现如下。
在这里插入图片描述
蓝绿色代表氨基酸,红色代表水。

有时候如果蛋白质整个呈灰色,类似如下:
在这里插入图片描述
就选择Setting/Rendering,取消勾选OpenGL 2.0 Shaders

显示氨基酸序列

PyMol的工具层,选择Display/Sequence,此时页面最上方就出现一连串氨基酸序列
在这里插入图片描述
最前面的/7dhg/是这个蛋白的PDB ID,然后就是一连串氨基酸序列,我们通常遍历一遍。

氨基酸残基或原子缺失(UCSF Chimera)

当我们在氨基酸序列中看到了类似---...---的部分时,这通常表示该位置的氨基酸残基缺失或者未被指定。我们需要使用UCSF Chimera工具去补全。
在这里插入图片描述

核苷酸

同时,如果我们看到这里的氨基酸序列里有一些DC DT DC一样的东西,其实这些是DNA核苷酸。在这里我将另一个蛋白5t01的氨基酸序列截图如下:
在这里插入图片描述
我们打开的fasta格式的文件可以更清楚地看见这一点(下文中有讲到fasta文件)
在这里插入图片描述
可以看到最后两条链都是ATGC
在这里插入图片描述
(其实看结构也能看得出来,黄色的就是DNA双螺旋结构。

带正电的氨基酸

在这里插入图片描述
如果一些氨基酸序列中有紫色的字母,那么这个代表着带正电的氨基酸,一般不需要去除。

添加分子伴侣/重要离子/小分子

对于有些蛋白,譬如血红蛋白,如果能先螯合二价铁离子,是有利于后续分子对接的。

去除水

下文操作仅展示基础操作,实际上进阶操作是需要先查阅文献或者相关数据库,譬如PDB数据库,区分一下保守水分子和结晶水分子。一般我们要去除的是结晶水分子,而保留保守水分子。

当我们遍历到氨基酸序列的最右边,可以看到有很多数字0,这个也代表水。
在这里插入图片描述

pymol的最右侧,有五个简写字母:

  • A(ction) 是进行一些操作
  • S(how) 是可视化的一些设置
  • H(ide) 是隐藏一些可视化的设置,和S是对应的
  • L(able) 是打标签
  • C(olor) 是上色
    在这里插入图片描述
    点击A字母后可以看到有remove waters的选项,即“去除水”
    在这里插入图片描述
    此时再看界面就会发现没有红色的小点了,也就是没有水了
    在这里插入图片描述
    同时,可以看到氨基酸序列的代表水的数字0不见了
    在这里插入图片描述

去除配体

我们点击A,找到present/publication(with solver)
在这里插入图片描述
页面就变成了如下:
在这里插入图片描述
这主要是方便看是否有残存的配体。
此时氨基酸序列也会逐渐变色,配体的颜色就显得比较突兀,如下IOK就是一个配体,需要去除(不是该蛋白的序列,仅拿来演示):
在这里插入图片描述

调整背景颜色

我们可以在设置中调整背景颜色
在这里插入图片描述

保存PDB/mol文件或者图像

命令保存文件

PyMol自带的终端里面输入:
save 文件名.pdb
即可保存,mol文件同理

设置保存文件或图像

可以通过save设置保存。文件名不需要加上.pdb。本人一般都输入蛋白质PDB ID_pymoled,譬如这里的7dhg_pymoled
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

命令行

我们可以看到pymol有自带的命令行终端。
输入cmd.do("reset")会重置当前的会话,包括所有的视图和加载的分子。
同时也有正常cmd有的lscd等命令,且可以tab补充,但是没有提供清空终端的命令(属实愚蠢

查看蛋白结构有几条链

这里还要介绍如何查看一个蛋白的结构有几条链。请注意,我们的演示蛋白换成了5t01

氨基酸序列观察

你可以直接通过氨基酸序列进行观察,如下(我已经完成去水和去配体的操作):
在这里插入图片描述
在这里插入图片描述
那么这里就可以看到,/A//B//C//D/,那么一共是有四条链的。

get_chains查看

也可以通过命令行查看

get_chains

在这里插入图片描述
可以看到,它有四条链。

导出成fasta格式观察

或者我们直接给他导出成fasta格式的文件,在命令行输入

save 5t01.fasta, 5t01

如下:
在这里插入图片描述
这里逗号后面的5t01主要是看氨基酸序列最开始是什么
在这里插入图片描述
可以看到/5t01/,所以是5t01

导出的fasta格式文件用文本编辑器打开,如下:
在这里插入图片描述
也可以看到是有四条链的,同时可以更清楚地看到蛋白质内部的序列。譬如最后一条链我们可以看到有一个?,代表着缺失。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鸡鸭扣

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值