通过blast结果选择完全overlap的序列

根据blast结果选择完全overlap的序列,此时没有考虑identity的高低

Query	Target	overlap_length	identity	Query_length	Target_length	Percent	Q_start	Q_end	T_start	T_end	strand
UN065663	maker-lcl|TGACv1_scaffold_643943_U_UN149109-augustus-gene-0.4-mRNA-1	225	97.8%	697	225	32.3%	285	566	0	225	-
UN065663	maker-lcl|TGACv1_scaffold_643943_U_UN133597-augustus-gene-0.4-mRNA-1	225	97.8%	697	225	32.3%	285	566	0	225	-
UN065663	maker-lcl|TGACv1_scaffold_643943_U_UN130225-augustus-gene-0.4-mRNA-1	225	97.8%	697	225	32.3%	285	566	0	225	
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Blast是一种常用的生物信息学工具,用于比对DNA或蛋白质序列来寻找相似性。而索引转序列是指根据Blast结果中的索引信息,从数据库中提取相应的序列。 具体步骤如下: 1. 准备输入文件:首先,我们需要准备一个包含Blast结果的文件,该文件通常被称为Blast输出文件或报告文件。该文件包含了与我们查询序列相似的序列的索引信息。 2. 解析Blast输出文件:我们需要将Blast输出文件解析为可操作的数据结构,以便能够提取索引信息。这可以通过编程语言如Python或Perl来完成。 3. 提取索引信息:一旦我们将Blast结果文件解析为可操作的数据结构,我们就可以提取出与查询序列相似的序列的索引信息。这些索引信息可以包括数据库中序列的唯一标识符或位置信息。 4. 查询数据库:接下来,我们使用提取的索引信息来查询包含原始序列的数据库。数据库可以是NCBI GenBank、UniProt等公共数据库,或者是自己建立的本地数据库。 5. 转换为序列:一旦我们从数据库中获取到相应的序列,我们将其转换为序列格式(如FASTA格式)或其他我们需要的格式,以便进一步分析或使用。 索引转序列是一个很有用的功能,它使我们能够根据Blast结果快速获取到与查询序列相似的序列。这对于进一步研究或分析所查询的序列的功能和特性非常有帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值