linux提取fasta文件的id,从大的fasta文件中提取特定的fasta序列

我想使用以下脚本从大的fasta文件中提取特定的fasta序列,但输出为空。从大的fasta文件中提取特定的fasta序列

transcripts.txt文件包含我想从assembly.fasta到selected_transcripts.fasta导出的列表转录本ID(ID和序列)。 例如:

transcripts.txt: Transcript_00004|5601

Transcript_00005|5352

assembly.fasta:>Transcript_00004|5601

GATCTGGCGCTGAGCTGGGTGCTGATCGACCCGGCGTCCGGCCGCTCCGTGAACGCCTCGAGTCGGCGCCCGGTGTGCGTTGACCGGAGATCGCGATCTGGGGAGACCGTCGTGCGGTT

>Transcript_00004|5360

CGATCTGGCGCTGAGCTGGGTGCTGATCGACCCGGCGTCCGGCCGCTCCGTGAACGCCTCGAGTCGGCGCCCGGTGTGCGTTGACCGGAGATCGCGATCTGGGGAGACCGTCGTGCGGTT

的ID由>符号开头:>Transcripts_00004|5601。

我要读的assembly.fasta文件,如果在assembly.fasta成绩单ID是transcripts.txt相同的写的,我必须写这份成绩单ID及其selected_transcripts.fasta序列。所以,在上面的例子中,我只需要写第一个成绩单。

有什么建议吗? 谢谢。

from Bio import SeqIO

my_list = [line.split(',') for line in open("/ho

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值