提取一个数据的子集

perl脚本练习

要求

根据提供的ID,提取一个数据的子集输出到一个新的文件

数据

表达矩阵
在这里插入图片描述
目标基因ID
在这里插入图片描述

思路
  1. 目标基因按行循环读取,获得一个哈希,基因名为键
  2. 表达矩阵按行读取,提取基因名,判断是否存在哈希的键中,如果存在就输出这一行,没有就跳过
代码
open(IN, "D:/exp.txt") || die "$!";
open(INID, "D:/id.txt") || die "$!";
open(OUT, ">D:/out.txt") || die "$!";

my %keep_id=();
while(my$line=<INID>){
	chomp $line;
	$keep_id{$line}=1;
}
close(INID);

while(my$line=<IN>){
	chomp $line;
	my @tmp=split(/\t/, $line);
	if (exist($keep_id{$tmp[0]}){
		print OUT$line."\n";
	}	
}
close(IN);
close(OUT);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值