使用python处理fasta文件——一个序列的多行表示变成单行表示

最新推荐文章于 2022-01-02 19:46:50 发布

xiaobai1_1

最新推荐文章于 2022-01-02 19:46:50 发布

阅读量2.8k

点赞数 8

文章标签： python

本文链接：https://blog.csdn.net/xiaobai1_1/article/details/107330739

版权

如下图所示，我们从网站上下载来的数据可能是这样的，但是我们使用它时可能需要ID一行，然后序列一行。

在这里插入图片描述

一个序列的多行表示变成单行表示则需要这样处理：

fr=open('data/dna-binding.fasta', 'r')  #读文件
fw=open('data/out.fasta', 'w')  #写文件
seq={}
for line in fr:
    if line.startswith('>'):    #判断字符串是否以‘>开始’
        name=line.split()[0]    #以空格为分隔符。
        seq[name]=''
    else:
        seq[name]+=line.replace('\n', '')
fr.close()

for i in seq.keys():
    fw.write(i)
    fw.write('\n')
    fw.write(seq[i])
    fw.write('\n')
fr.close()

这里的dna-binding.fasta文件是自己下载下来的fasta文件（我里面就是放的上面这几个序列）。out.fasta就是输出的文件格式如下
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xiaobai1_1

关注关注

8
点赞
踩
28

收藏

觉得还不错? 一键收藏
2
评论
使用python处理fasta文件——一个序列的多行表示变成单行表示

如下图所示，我们从网站上下载来的数据可能是这样的，但是我们使用它时可能需要ID一行，然后序列一行。一个序列的多行表示变成单行表示则需要这样处理：fr=open('data/dna-binding.fasta', 'r') #读文件fw=open('data/out.fasta', 'w') #写文件seq={}for line in fr: if line.startswith('>'): #判断字符串是否以‘>开始’ name=line.split
复制链接

扫一扫