Discovery Studio™ (简称DS)是专业的生命科学分子模拟软件,DS目前的主要功能包括:蛋白质的表征(包括蛋白-蛋白相互作用)、同源建模、分子力学计算和分子动力学模拟、基于结构药物设计工具(包括配体-蛋白质相互作用、全新药物设计和分子对接)、基于小分子的药物设计工具(包括定量构效关系、药效团、数据库筛选、ADMET)和组合库的设计与分析等。
同源建模基于两个原理。第一,一个蛋白质的结构由其氨基酸序列唯一决定,知道其一级序列,在理论上就可以获取其二级结构以及三级结构。第二,蛋白质的三级结构在进化中更稳定或者说更保守。同源建模方法可实现由一级氨基酸序列预测蛋白三维晶体结构。这里利刃君就为大家带来在Discovery Studio中基于蛋白序列构建同源蛋白模型教程。
1 模板选取
1)载入序列
利刃君这里以GPR35蛋白为例,由Uniprot网址下载GPR35蛋白的一级序列,由309个氨基酸组成如下图,下载.FASTA文件或直接复制序列。
打开Discovery Studio软件,点击File>New>Protein Sequence Window,新建蛋白序列窗口,将复制好的氨基酸序列粘贴至序列窗口中。
在系统视图中通过鼠标右键Rename Sequence...更改序列名称为GPR35。
2) 模板搜索
在工具栏中,点击Macromolecules>Search Sequences by Similarity>BLAST Search,打开BLAST Search 对话框。
在对话框中,点击Input Sequence 参数右边的栅格,下拉列表中选择Protein Sequence Window:GPR35;
点击Input Database 参数右边的栅格,下拉列表中选择PDB_nr95,在序列同源性在95%时无冗余的信息数据库中搜索模板。
点击Run运行任务。
任务完成后,可以看到一共有25个模板被筛选出来,表格中展示了这些模板的信息,包括同源性、模板长度、来源等等。
这些模板按照E值大小进行了排序,E值越低表明序列比对的可靠性越高。
点击GPR35窗口下的Map View 标签可看到筛选的结果图。图中每条线表示一条序列。每根横条根据bit score 打分不同而配以不同的颜色。
将鼠标放置在某一个命中序列上,可显示有关该序列的相关信息。一般情况下,我们需选择同源性大于30%的模板进行建模。
2 序列比对
这里我们选择3VW7、4EA3、4DKL、4N6H以及2LNL这五个蛋白作为模板,从PDB数据库中下载这五个蛋白的晶体结构。
在软件中新建一个Molecule窗口,导入下载好的五个蛋白结构。
在工具栏中,点击Macromolecules>Create Homology Models>Align Sequence to Templates,打开Align Sequence to Templates 对话框。点击Input Model Sequence右边的栅格,在下拉列表中选取GPR35;点击Input Template Structures右边的栅格,选择Molecule:All确保5 个模板结构都已选中。点击Run运行作业,等待作业完成。
任务完成后,出现序列比对窗口,模板蛋白与GPR35序列进行了比对,我们可以看到序列的重复情况。
在序列窗口中,在菜单栏中点击选择Sequence>Secondary structure>Visibility,选中PDB 和Kabsch-Sander选项,点击OK。五个模板序列的下方会出现根据PDB 和Kabsch-Sander 两种方法进行标识的相应序列的二级结构图。红色横条代表α螺旋,蓝色箭头代表β折叠。
3 同源建模
我们使用比对结果和模板蛋白结构进行GPR35基于序列的同源模型构建。
在工具栏中,点击Macromolecules>Create Homology Models>Build Homology Models,打开Build Homology Models 对话框。点击Input Sequence Alignment右边的栅格,下拉列表中选取GPR35_templates:All;确保Input Templates Structures一栏中,选择3VW7,4DKL,2LNL这三个模板蛋白。点击Input Model Sequence右边的栅格,下拉列表中选取GPR35。Number of Models可以设置生成模型的数量,这里设为20。点击Optimization Level右边的栅格,可以选择模型的精度,这里选取High。点击Run运行任务。
任务完成后,可以通过Report页面查看模型构建结果。构建的模型依据PDF Total Energy值进行了排序。
- PDF函数定义了蛋白结构中诸如键长、键角、二面角等几何特性,直接反应了模型的好坏。一般,模型的PDF Total Energy越低,表明该模型在同源约束条件下优化的越好,模型可信度越高。
- 同样的,DOPE score 是衡量模型质量的依据,分数越低,模型质量越可靠。
点击View Result可查看所构建模型的3D结构,模型是否合理还需要进一步评估。
以上就是利刃君为大家带来的利用Discovery Studio 2016软件进行同源建模的教程啦~