BLAST下载和基因数据获取
因为没有实操经验,就不做过多介绍了
有需要的可以去link中查看
制作blast数据库
首先,先尝试对单个材料进行建库操作
下载下来的序列数据都为.gz的压缩文件,需要首先对其解压
mkdir XX #先随便创建一个文件夹
makeblastdb -in ./xx.fna -out XX/xx -dbtype nucl
其中,xx为需要建库的材料
-in 即为输入的文件
-out 即为输出的文件
-dbtype 输入的序列类型
需要注意的是,在输出途径中,一定要为完整的 目录名/文件名
根据单个材料的代码,建立大批量建库脚本
(脚本为python脚本)
import os
files = os.listdir('./xx') #xx为待建库文件所在目录
for genome in files:
db_name = genome.strip('.fna') #去除文件的后缀
mdb = f"makeblastdb -in ./xx/{db_name} -out db/{db_name}/{db_name} -dbtype nucl"
os.system(mdb)
代码成功运行后会在当前目录下简历一个为db的目录
如果想要指定目录位置,则在输出目录前指定途径