问题:有一个fasta文件,其中>后面只有名字,现在要依据另外一个txt文件将附属说明添加到对应名字中。
解决:用perl很方便的可以解决。
思路:
1、先打开txt文件,读取关键字和附加说明。
2、再打开fasta文件,将关键字和>后面的名字对比。如果相同就将附加说明添加上去。并将其后面的序列重新写入新的文件中。
这一块用了flag标识。0代表未匹配状态,1代表已经匹配,2代表链接完后面序列。
代码如下:
#!/usr/bin/perl -w
use strict;
my $sourceName="Mortierella_0%_P450_28seq.txt";#关键字+附加txt文件
my $targetName="annotation.fasta";#fasta文件
my $flag=0;
open(myFile,$targetName)|| die ("Could not open file");
while(my $myLine = <myFile>){
my @array=split/\t/,$myLine;
my $keyWord=$array[0];
my $addtion=$array[1];
$flag=0;
open(sourceFile,$sourceName)|| die ("Could not open file");
while(my $sourceLine = <sourceFile>){
if($sourceLine =~/>/ && $flag==0){
chomp($sourceLine);
@array=split/>/,$sourceLine;
my $nowWord=$array[1];
if($nowWord eq $keyWord)
{
$flag=1;
open(OUTFILE,">>result.fasta")|| die ("Could not open file");
print OUTFILE ($sourceLine."\t".$addtion);
next;
}
}
if($flag==1 && !($sourceLine =~/>/)){
print OUTFILE ($sourceLine);
}
elsif($flag==1 && $sourceLine =~/>/)
{
$flag=2;
}
}
close(OUTFILE);
close(sourceFile);
}
close(myFile);