蛋白质晶体结构解析3-建模与精修

最新推荐文章于 2025-05-31 20:55:29 发布

纪伊路上盛名在

最新推荐文章于 2025-05-31 20:55:29 发布

阅读量1.5k

点赞数 15

分类专栏：生信推文-结构生物学文章标签：学习知识图谱学习方法笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_62528784/article/details/145192619

版权

生信推文-结构生物学专栏收录该内容

19 篇文章

订阅专栏

参考我的上一篇博客:
https://blog.csdn.net/weixin_62528784/article/details/144830955

文件如下：

一，phenix方面：

1，新建文件夹处理：

项目名称：hw（homework）
工作文件夹：此处放置在含有mtz文件的文件夹内

序列文件也选上

总体上而言：我们精修的是TleB蛋白质，目前已经有了X射线晶体衍射结构以及相关pdb模型

也就是

2，运行Xtriage程序

大概配置如下：

第一行的衍射数据就使用前面那个文件夹里的mtz文件，序列文件也一并用上（就是TleB该蛋白的）

点击确认之后就在运行：

对于输出结果，有很多指标可以查看：

有很多其他的条目可以翻阅：

3，运行Phaser程序：回到phenix home界面

注意是分子置换的选项界面内

同样的衍射数据选择mtz那个文件，和前面一样

接着进入第2个选项ensembles：

选择文件夹中的那个pdb文件

注意！这里的序列相似性不要选择100%，即使是同个蛋白用AF3预测的结构，也要给一点自由度

整体如下：

然后接着是第3栏：

再接着是第4栏：

操作如下：

我的模型中蛋白的数目x搜索的copy=每个不对称中心中蛋白质的数目

然后我十分确认就是这个空间群，所以不用浪费时间了，我就直接选择No alternatives

然后就是直接run

然后运行结果如下：

TFZ最好大于10，分子置换的结果就八九不离十了，说明后续精修不会太费力了

注意输出的位置以及文件：

4，在分子置换之后可以使用coot进行精修，同时查看结果

没有关联好wincoot的路劲，就需要自己导入这个模型结果了（mtz以及pdb）

注意在coot中是打开分子置换之后的pdb以及mtz文件

pdb是结构文件，mtz是经过分子置换之后得到的分子密度文件

蓝色的电子密度其实就是2Fo-Fc，

如果是绿色的电子密度就是Fo-Fc（Fo是observation，观测、实验、衍射数据；Fc是calculation，根据模型计算出来的）

如果Fo-Fc>0，代表着Fo是有东西的，Fc是没有东西的，也就是说明我们的模型里没有东西，但是实际观测是能看到东西的，也就是绿色的；

红色的正好相反，就是Fo-Fc<0，观测obs是看不到东西的，但是我们的模型在这里有东西；

所以我们的模型精修理论上就是将红色的以及绿色的电子密度都搞没，然后理想情况下都是蓝色的；

其实可以看到，我们上面的模型就是几乎全部都是蓝色的

5，在获得分子置换的结果之后，首先不是人工精修，一般是先机器精修一次

实操：机器精修开始

其实就是原来分子置换结果右上角对应的refine的图标位置处

原始的衍射数据（注意！！在精修的时候永远永远使用我们最初的最原始的衍射的mtz的数据），此次的模型pdb，还有序列文件

然后跳到第2栏

然后注意机器第一遍精修的时候这里只要打开Rigid body（刚性模型）即可，其他的都不要动

number of cycles一般5轮起步

然后就是确认输出的文件位置

然后就是实时的优化精修进度：

如果关联了coot的话，这一步其实是可以自动打开coot观察精修的过程的

然后跑完之后的结果大概是：

然后左上角这里是全部的输出文件：

如何评价结果好还是不好，就可以从下面这4个参数中进行判断：

然后这4个指标在指定分辨率范围都有一定的标准值，那我怎么知道呢，其实是可以和标准的进行比较，就是点击下面的

总的来说就是大家的值（大多数分布的地方都在暖色调区域，如果我们在每一个维度坐标上分布的值超过了这些区域范围，就说明我们的分布的正常的标准分布不准）

然后每一个维度其实是可以点击上面的直方图展示直接观看效果的：

想看哪个维度就看哪个维度

比如说R-free

大致上大差不差；

然后同样使用coot查看精修的结果：
注意结果是在这里：refine3的mtz以及pdb

其实可以看到：在精修之后出现了很多红色以及绿色的电子云

=====》过程中如果不小心点击退出去程序了，可以重新打开

然后在操作历史里找到对应的操作执行部分即可，比如说上面是refine部分，我们就可以直接点击返回到之前的结果部分了

6，在coot中进行第一次人工精修：

将4个选项都选上

第一次人工精修的话，最好是从头到尾，也就是从蛋白的N端到C端；

可以goto选项，

或者点击空格键，就是跳到第一个原子，然后接着按空格就是前进，如果是shift+空格就是后退

可以放大看细节编号：
然后我这里的模型是最小只能跳到7号：

然后一个一个看的话，比如说我们可以看到12号这里有一个红色电子云

然后景深以及map level等需要进一步调整一下参数，在修改的时候可以更方便。

（1）然后可以对照序列进行分析：

打开一开始机器精修的refine部分的sequence check部分

比如说这里说10号位有一个mismatch

其实可以通过往前往后跳动观察一下是否有红绿色的电子云到底靠近编号是几的C-α，然后就可以判断到底是哪个位置上的氨基酸是有问题的了；总之从上面结果看，应该是10号位的氨基酸的侧链上的的电子云密度有点问题，当然对于氨基酸来说，侧链有问题，基本上就自然会想到侧链obs与模型不一致，而自然的氨基酸实际上也就是在侧链上不一样，所以很自然就想到是不是这里的氨基酸建模建错了，比如说应该是另外一个氨基酸；

总之我们接着查看sequence check部分：

细节可以view alignment

因为我们是从7开始，789-10，正好是第10个，

然后我们这里是Ile异亮氨酸

正常应该是Y也就是Tyr酪氨酸

那么我们精修的时候应该如何修改呢，点击右边的这个按钮：

我们点击这个按钮之后再点击我们要修改的10号位的氨基酸残基上的任意一个原子（都会被识别为要修改该号位的氨基酸）

然后就会弹出来一个要修改的列表

点击修改为Y即可

——》此处发现windows上的wincoot没安装好，换了一个linux上的coot接着按照上面操作

总之就是10这里不对，需要修改

果然，在linux上修改效果比较好，变成了Tyr

总之就是按照这里的进行修改：

直接这里就有goto哪个哪个atom

下一个就是50，接着修改：

R改成H

同样改完其他的氨基酸残基：

S改为M，再接着

A改为F

A改为W

F改为T

L改为F

R改为S

（2）然后就是在活性中心添加HEM

可以看到已经放进去了：

手动进入347 Cys

就是这里有一大片绿色的电子云，在这里添加HEM

然后我们在这里加入了HEM

合并之后进行微调：

最后初步精修效果大致如下：

HEM这个环有些细节还是没有移动上，然后就是随时保存精修之后的模型文件，也就是pdb文件

7，然后再用phenix的refine进行机器精修：

还是打开job history：然后还是refine这个界面，在input files上修改一下，主要是pdb的结构模型文件要使用此次精修之后的文件

或者在home中打开如下：

然后就是run，也就是下一轮机器的精修

精修结果：

其他的结果：

等

8，validation：

9，Molprobity：

其实这个模块在phenix中也是内置的，但是还是推荐在phenix外在线做

http://molprobity.biochem.duke.edu/index.php

然后注意上一步精修之后的结果放在文件夹：使用refine_4的pdb模型文件

选择上面精修好的模型pdb文件（实际过程中可以精修好多轮，假设上面的refine已经是我们精修之后达到要求了）

如果页面没反应就再上传pdb文件，直到跳转到界面：

点击continue：

首先是加氢add hydrogens

一般默认即可

然后机器判断我们这里188号位的His氨基酸侧链需要翻转，我们可以直接接受，然后它会帮助我们生成一个修改之后的pdb文件

点击continue

然后选择左上角的这个即可：

然后一切选择默认，直接运行即可

精修结果如下：

绿色代表没有问题，黄色有点问题，红色问题很大

细节部分可以查看下面的这个：

对于这些有误的地方，标红的残基需要再次打开coot进行手动精修

10，最后收集整理一下统计数据：

第一部分是data collection的，其实就是上一次博客的结果统计部分；

然后refinement部分是此次精修的部分，结果可以在phenix输出中找，也可以在PDB文件的表头（也就是remark中寻找）

——》然后因为使用都是同一个mtz文件，所以第一部分的结果其实就是上一篇博客的结果：

在文件correct.LP中

拉到这个文件的最后一部分：我们主要是获取分辨率最大的shell

注意是文件倒数向前最后一个的subset

最后一列的total就是一个平均的信息，

倒数第2行就是一个分辨率最高的一个shell的统计信息。

注意这里的文件的每一列的列名是占据了上下2行的，刚开始阅读时候容易把第2行也当做列名，其实是第一行中的列名写不下了；
这样竖着来看就正常多了。

纪伊路上盛名在

博客等级

码龄4年

175
原创

2082
点赞

2272
收藏

1357
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 快捷键备忘录-1

下一篇：: 相分离文献1

最新评论

bootstrap自助（抽样）法
纪伊路上盛名在: 2，补充2：函数使用简单的百分位数法(percentile method)构建置信区间，这种方法隐含了抽样分布对称的假设，在实际应用中可能存在局限性，也就是bias的出现，哪怕是中位数。所以，为了结果的可靠性，强烈建议：增加分布对称性检查、考虑使用BCa法或其他更稳健的置信区间方法，所以此处推荐使用https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.bootstrap.html，而不是自己编写
LLM再赋能1：vscode中提升效率的插件扩展——待更新
纪伊路上盛名在: 3，补充插件：continue、cursor，以及augment code插件
内网穿透2
纪伊路上盛名在: 3，zerotier近期用起来经常断联连不上，已经转tailscale，可以两个并用，tailscale更方便点，参考https://login.tailscale.com/
python3：文件与异常
纪伊路上盛名在: 1，补充1：python中最常见处理的数据类型就是list、dict以及json格式的数据，其中复杂的属dict以及json，json用法可以参考https://www.runoob.com/python/python-json.html，其中json.dumps用于将 Python 对象编码成 JSON 字符串，json.loads用于将已编码的 JSON 字符串解码为 Python 对象
python、R、shell兼容1
纪伊路上盛名在: 1，补充1：我在举的例子里其实并没有说清楚，如何python中的中间变量在R code中继承，R中的中间变量在Python code中继承，我会在后续抽空补完这个系列

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。