半学期在研究蛋白质相互作用位点的预测,由于生物短板,所以遇到很多困难。不说这些心酸事了,说一下这篇博客的内容吧。我仔细研读了一篇关于蛋白质相互作用位点预测的论文:Predicting protein interaction sites from residue spatial sequence profile and evolution rate(Bing Wanga,b,1, Peng Chena,b,1, De-Shuang Huanga,*, Jing-jing Lia,Tat-Ming Lokc, Michael R. Lyud)这篇论文的数据是来自Fariselli et al研究的113对蛋白质链,对着226条蛋白质链进行了去除冗余,使用了blast软件,本文主要就介绍如何使用此软件实现去除冗余的过程。原文如下:
After removal of redundant chains, we obtained a data set of 69 protein
chains (sequence identity <30%); all the data are available upon request.
Blast安装
在ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ 下载对应版本,我下载的是windows版本,直接安装即可,添加环境变量即可使用。
安装完成后,在安装目录里可以看到很多功能,比如blastp,makeblastdb就是我所使用的两个程序。如图
创建自定义数据库makeblastdb
需要