本文中的Windows平台本地化blast2.9生成pssm的方法主要来源于以下两篇文章
https://blog.csdn.net/cpc784221489/article/details/88879650
https://blog.csdn.net/cpc784221489/article/details/88879650
然后根据自己的实际情况以及文件的路径略微进行了调整。
1、cmd命令进入其他盘文件(一直记不住,决定写进来,希望自己能记住)
2、命令提示符 pssm命令
我所对比的是swissprot数据库
第一种:
将要生成pssm文件的fasta文件放入bin文件夹中,输入以下命令
D:\Program Files\NCBI\blast-2.9.0+\bin>psiblast -query 1.fasta -db sp -num_iterations 3 -out 1 -out_ascii_pssm 1.pssm
或
D:\Program Files\NCBI\blast-2.9.0+\bin>psiblast -query 1.fasta -db sp -evalue 0.001 -num_iterations 3 -out 1 -out_ascii_pssm 1.pssm
第二种:
把fasta文件放入db文件夹里,输入以下命令
D:\Program Files\NCBI\blast-2.9.0+\bin>bin\psiblast -db sp -query db\1.fasta -evalue 0.001 -num_iterations 3 -out_ascii_pssm 1.pssm
第一种方法的运行速度要比第二个快一点。
3、批量生成pssm命令
部分(其余部分第一个链接中)
visitDir("D:/Program Files/NCBI/blast-2.9.0+/db/cy/") print(fileNum) for i in range(0,fileNum): os.system(r'D:/"Program Files"/NCBI/blast-2.9.0+/bin/psiblast.exe -query D:/"Program Files"/NCBI/blast-2.9.0+/db/cy/'+ str(i)+".fasta"+" -db sp -num_iterations 3"+" -out_ascii_pssm "+str(i)+".pssm")
最开始根据第一个链接中的代码修改了路径如下,但一直报错
因为自己是个渣渣,看了很久才明白过来报错是什么问题,这不就是program后面的东西读不出来嘛,然后开始在百度上搜,才知道os.system()不能处理空格,解决的方法就是在路径前加r'',并在有空格的地方加入双引号"",然后问题解决。
pssm生成了,接下来我该看怎么进行特征提取了……
身为渣渣的我,真的觉得好难啊……