从fasta文件中筛选序列并输出

参考网上资源,得到两种实现方式:

1. 参考https://stackoverflow.com/questions/34495490/extract-specific-fasta-sequences-from-a-file-using-perl?r=SearchResults

#! /usr/bin/perl
use strict;
use warnings;

open A_SPEC, $ARGV[0] or die;
open DATA, $ARGV[1] or die;

my %list;
while (<A_SPEC>) {
	chomp;
	$list{$_}++;
	}

my $select;
while (<DATA>) {
	if (/^>(\S+)/) {
	$select = exists $list{$1} ? 1 : 0;
	}
	print $_ if $select;
}

2. 前边读取列表方式一样,参考http://blog.sina.com.cn/s/blog_7d001f3d0101nw69.html

#! /usr/bin/perl
use strict;
use warnings;

open A_SPEC, $ARGV[0] or die;
open DATA, $ARGV[1] or die;

my %list;
while (<A_SPEC>) {
	chomp;
	$list{$_}++;
	}

# 把默认的行间隔符号"\n"改为">";那么每个里面,读进来的一行数据是比如 "seq1\nATCGAGCDGACGTACG>"
local $/ = ">";	 # $/在perl中是输入记录分隔符,影响perl对"行"的理解。默认是换行符"\n".也可以定义为其他的内容

<DATA>; # 跳过首行

while (<DATA>) {
	chomp;
	/^(\S+)/;
	if (exists $list{$1}) {
	print ">$_";}
	}

$/ = "\n";

如有侵权,请告知删除。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值