1。Perl:一行代码,使用模式匹配和reverse()函数即可
#!perl
my $barcode=$ARGV[0];
my $R1=$ARGV[1];
print '$ARGV[0]==>',$ARGV[0],"\n";
print '$ARGV[1]==>',$ARGV[1],"\n";
open (MARK, "< $barcode") or die "can not open it!";
open (NEWR1,"> $R1")or die "can not open new file!";
my $line;
my $line_rev;
while ($line = <MARK>){
$line=~ s/[\n\r]//g;
$line=~tr/CATG/GTAC/; #互补碱基一一匹配
$line_rev =reverse $line; #逆序
print NEWR1 "$line_rev\n";
}
close (MARK);
close (NEWR1);
2。Python:逐个遍历判断数组的每一项,取逆反,后拼接成完整的字符串
def revComp(seq, comp=''):
'''
convert string to reverse sequence
converts DNA seq to reverse complement if 'comp' is set to not empty
'''
outstr = ''
#seq = seq[:len(seq)-1]
seq = seq[:len(seq)] #列表的切片
i = 0 #索引变量
n = len(seq) #遍历的上阈
while i < n:
#reverse sequence of char
currNt = seq[n - i - 1] #实现了倒序,取一个值
#convert to complementary base
if comp:
if currNt == 'A':
currNt = 'T' #赋值
elif currNt == 'T':
currNt = 'A'
elif currNt == 'C':
currNt = 'G'
else:
currNt = 'C'
outstr += currNt #字符的拼接,使用+
i += 1
return outstr #这个代码实现的功能也简单,逐个的遍历列表的每一项,取逆反序列 #逻辑上不难实现
name = "AAATGCGAC"
print (name)
print(revComp(name,comp='TRUE'))
所以,论字符串的处理,我还是比较欣赏perl的。代码书写上,非常的简洁。
就像做数学题一样,有时候可以自己跟自己做游戏。同一个问题,有没有更加简洁快速的解决方法。这样不断的开拓和拔高,会非常的有意思。