linux提取fasta文件的id,从大的fasta文件中提取特定的fasta序列

最新推荐文章于 2024-04-12 19:30:00 发布

佐仓汐

最新推荐文章于 2024-04-12 19:30:00 发布

阅读量1.7k

点赞数

文章标签： linux提取fasta文件的id

我想使用以下脚本从大的fasta文件中提取特定的fasta序列，但输出为空。从大的fasta文件中提取特定的fasta序列

transcripts.txt文件包含我想从assembly.fasta到selected_transcripts.fasta导出的列表转录本ID(ID和序列)。例如：

transcripts.txt： Transcript_00004|5601

Transcript_00005|5352

assembly.fasta：>Transcript_00004|5601

GATCTGGCGCTGAGCTGGGTGCTGATCGACCCGGCGTCCGGCCGCTCCGTGAACGCCTCGAGTCGGCGCCCGGTGTGCGTTGACCGGAGATCGCGATCTGGGGAGACCGTCGTGCGGTT

>Transcript_00004|5360

CGATCTGGCGCTGAGCTGGGTGCTGATCGACCCGGCGTCCGGCCGCTCCGTGAACGCCTCGAGTCGGCGCCCGGTGTGCGTTGACCGGAGATCGCGATCTGGGGAGACCGTCGTGCGGTT

的ID由>符号开头：>Transcripts_00004|5601。

我要读的assembly.fasta文件，如果在assembly.fasta成绩单ID是transcripts.txt相同的写的，我必须写这份成绩单ID及其selected_transcripts.fasta序列。所以，在上面的例子中，我只需要写第一个成绩单。

有什么建议吗？谢谢。

from Bio import SeqIO

my_list = [line.split(',') for line in open("/ho

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
linux提取fasta文件的id,从大的fasta文件中提取特定的fasta序列

我想使用以下脚本从大的fasta文件中提取特定的fasta序列，但输出为空。从大的fasta文件中提取特定的fasta序列transcripts.txt文件包含我想从assembly.fasta到selected_transcripts.fasta导出的列表转录本ID(ID和序列)。例如：transcripts.txt： Transcript_00004|5601Transcript_00005...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。