这是我导师给我的一个任务
从一个很大的fasta文件提取序列名称含有特定字样的序列,合成新的fasta文件
一开始一直想不到怎么去做,知道调用了split-fasta这个python库。
话不多说,上代码!
(这是基于windows下的啊
打开pycharm copy好文件到项目目录
系统终端输入:
pip install spilt-fasta
之后直接在命令行(系统终端命令行,不是python的)
splitfasta 你要分割的fasta文件名.fasta
之后他会创建一个目录test_split_files,里面就是分割好的文件
借来下执行下列python代码,按需要修改
import os
path = "test_split_files" #文件夹目录
filenames=os.listdir(r