提取fasta格式文件中的指定多个序列

输入文件1:背景fasta文件
输入文件2:目标序列id,以单列的形式
如:

seq1
seq2
seq3

下面是代码原文

import sys,re
def displayfq_f(f):
	dickf = {}
	for i in f:
		if re.match(">",i):
			dickf[i]=""
			flag = i
		else:
			dickf[flag] = dickf[flag]+i
	return dickf
f = open(sys.argv[1],"r")
f_list = open(sys.argv[2],"r")
dickf = displayfq_f(f)
for i in f_list:
	i = i.strip()
	for j in dickf.keys():
		if re.match(">"+i,j):
			print(j,end="")
			print(dickf[j])
f.close()
f_list.close()

打印的结果,所以使用的时候记得定向输出

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要将一个多序列fasta文件合并一个以">"开头的序列,可以按照以下步骤进行操作: 1. 首先,找到fasta文件以">"开头的目标序列的标题行和序列行。这可以通过查找文件以">"开头的行来实现。 2. 将目标序列的标题行和序列提取出来,并保存为一个新的fasta文件。 3. 如果需要合并多个fasta文件的目标序列,可以重复上述步骤,将每个fasta文件的目标序列提取出来,并添加到同一个新的fasta文件。 请注意,合并fasta文件时,需要确保每个序列的标题行以">"开头,并且序列行没有换行符。另外,合并后的fasta文件应该符合fasta格式的规范。 希望这个回答对您有帮助!\[1\]\[2\] #### 引用[.reference_title] - *1* *2* [一条命令实现fasta序列多行变单行](https://blog.csdn.net/weixin_44022515/article/details/104257520)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码](https://blog.csdn.net/beijinghorn/article/details/130487663)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值