c# 联合halcon 基于相关性 模板匹配_分子模拟软件Discovery Studio教程(十七):基于氨基酸序列同源建模...

Discovery Studio™ (简称DS)是专业的生命科学分子模拟软件,DS目前的主要功能包括:蛋白质的表征(包括蛋白-蛋白相互作用)、同源建模分子力学计算和分子动力学模拟基于结构药物设计工具(包括配体-蛋白质相互作用、全新药物设计和分子对接)、基于小分子的药物设计工具(包括定量构效关系、药效团、数据库筛选、ADMET)和组合库的设计与分析等

71fa2da3373012a96279a386ffde3261.png

同源建模基于两个原理。第一,一个蛋白质的结构由其氨基酸序列唯一决定,知道其一级序列,在理论上就可以获取其二级结构以及三级结构。第二,蛋白质的三级结构在进化中更稳定或者说更保守同源建模方法可实现由一级氨基酸序列预测蛋白三维晶体结构。这里利刃君就为大家带来在Discovery Studio中基于蛋白序列构建同源蛋白模型教程。

1 模板选取

1)载入序列

利刃君这里以GPR35蛋白为例,由Uniprot网址下载GPR35蛋白的一级序列,由309个氨基酸组成如下图,下载.FASTA文件或直接复制序列。

1820766c83cf051c56851ce9b27b646e.png

打开Discovery Studio软件,点击File>New>Protein Sequence Window,新建蛋白序列窗口,将复制好的氨基酸序列粘贴至序列窗口中。

在系统视图中通过鼠标右键Rename Sequence...更改序列名称为GPR35。

94ed84c88d4c3a8ddef0e6d66f19259d.png

2) 模板搜索

在工具栏中,点击Macromolecules>Search Sequences by Similarity>BLAST Search,打开BLAST Search 对话框。

在对话框中,点击Input Sequence 参数右边的栅格,下拉列表中选择Protein Sequence Window:GPR35

点击Input Database 参数右边的栅格,下拉列表中选择PDB_nr95,在序列同源性在95%时无冗余的信息数据库中搜索模板。

点击Run运行任务。

56148bb050b1bdf2b544c708962e8cd8.png

任务完成后,可以看到一共有25个模板被筛选出来,表格中展示了这些模板的信息,包括同源性、模板长度、来源等等。

这些模板按照E值大小进行了排序,E值越低表明序列比对的可靠性越高。

5f9351684f8a37896899ef9b75837f04.png

点击GPR35窗口下的Map View 标签可看到筛选的结果图。图中每条线表示一条序列。每根横条根据bit score 打分不同而配以不同的颜色。

7788b1fc8b3f61b923ac16e65d3f683c.png

将鼠标放置在某一个命中序列上,可显示有关该序列的相关信息。一般情况下,我们需选择同源性大于30%的模板进行建模。

2 序列比对

这里我们选择3VW7、4EA3、4DKL、4N6H以及2LNL这五个蛋白作为模板,从PDB数据库中下载这五个蛋白的晶体结构。

在软件中新建一个Molecule窗口,导入下载好的五个蛋白结构。

1b401db18c5ab107608f6001169b6642.png

在工具栏中,点击Macromolecules>Create Homology Models>Align Sequence to Templates,打开Align Sequence to Templates 对话框。点击Input Model Sequence右边的栅格,在下拉列表中选取GPR35;点击Input Template Structures右边的栅格,选择Molecule:All确保5 个模板结构都已选中。点击Run运行作业,等待作业完成。

135c689f6ca62109a3fb1aa949680ee9.png

任务完成后,出现序列比对窗口,模板蛋白与GPR35序列进行了比对,我们可以看到序列的重复情况。

d3fdf9cc46e95faf7b71354af9ce41dc.png

在序列窗口中,在菜单栏中点击选择Sequence>Secondary structure>Visibility,选中PDB 和Kabsch-Sander选项,点击OK。五个模板序列的下方会出现根据PDB 和Kabsch-Sander 两种方法进行标识的相应序列的二级结构图。红色横条代表α螺旋,蓝色箭头代表β折叠。

267f475c2189748a5d4e378325ba678d.png

3 同源建模

我们使用比对结果和模板蛋白结构进行GPR35基于序列的同源模型构建。

在工具栏中,点击Macromolecules>Create Homology Models>Build Homology Models,打开Build Homology Models 对话框。点击Input Sequence Alignment右边的栅格,下拉列表中选取GPR35_templates:All;确保Input Templates Structures一栏中,选择3VW7,4DKL,2LNL这三个模板蛋白。点击Input Model Sequence右边的栅格,下拉列表中选取GPR35Number of Models可以设置生成模型的数量,这里设为20。点击Optimization Level右边的栅格,可以选择模型的精度,这里选取High。点击Run运行任务。

461d3af8fd7fc9e87fbb8f57203ed536.png

任务完成后,可以通过Report页面查看模型构建结果。构建的模型依据PDF Total Energy值进行了排序。

  • PDF函数定义了蛋白结构中诸如键长、键角、二面角等几何特性,直接反应了模型的好坏。一般,模型的PDF Total Energy越低,表明该模型在同源约束条件下优化的越好,模型可信度越高。
  • 同样的,DOPE score 是衡量模型质量的依据,分数越低,模型质量越可靠。

b29aaaadfe9e8c7f3454a118bfbad5b5.png

点击View Result可查看所构建模型的3D结构,模型是否合理还需要进一步评估。

6afde3f90373a07baf0772a0ca647ddf.png

以上就是利刃君为大家带来的利用Discovery Studio 2016软件进行同源建模的教程啦~

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值