项目实战 | 分别用Python和perl 实现取DNA序列的逆反序列

本文链接：https://blog.csdn.net/weixin_40640700/article/details/120633303

1。Perl：一行代码，使用模式匹配和reverse（）函数即可

#!perl
my $barcode=$ARGV[0];
my $R1=$ARGV[1];
print '$ARGV[0]==>',$ARGV[0],"\n";
print '$ARGV[1]==>',$ARGV[1],"\n";

open (MARK, "< $barcode") or die "can not open it!";
open (NEWR1,"> $R1")or die "can not open new file!";
my $line;
my $line_rev;
while ($line = <MARK>){
	$line=~ s/[\n\r]//g;	
	$line=~tr/CATG/GTAC/;  #互补碱基一一匹配
	$line_rev =reverse $line; #逆序
	print NEWR1 "$line_rev\n";
} 
close (MARK);
close (NEWR1);

2。Python：逐个遍历判断数组的每一项，取逆反，后拼接成完整的字符串

def revComp(seq, comp=''):
    '''
    convert string to reverse sequence 
    converts DNA seq to reverse complement if 'comp' is set to not empty
    '''
    outstr = ''
    #seq = seq[:len(seq)-1]
    seq = seq[:len(seq)] #列表的切片
    i = 0 #索引变量
    n = len(seq) #遍历的上阈
    while i < n:
        #reverse sequence of char
        currNt = seq[n - i - 1] #实现了倒序,取一个值
        #convert to complementary base
        if comp:
            if currNt == 'A':
                currNt = 'T' #赋值
            elif currNt == 'T':
                currNt = 'A'
            elif currNt == 'C':
                currNt = 'G'
            else:
                currNt = 'C'        
        outstr += currNt #字符的拼接，使用+
        i += 1
    return outstr #这个代码实现的功能也简单，逐个的遍历列表的每一项，取逆反序列 #逻辑上不难实现
    
name = "AAATGCGAC"
print (name)
print(revComp(name,comp='TRUE'))