一、几个问题
1.找出不包含"abc"的字符串
测试用例1==>abc(不符合)
测试用例2==>xabc(不符合)
测试用例3==>abcy(不符合)
测试用例4==>xabcy(不符合)
测试用例5==>xxxx xabcy(不符合)
测试用例6==>xxx abcy dabc(不符合)
测试用例7==>abcy(不符合)
测试用例8==>xyz(符合)
2.截出指定位置(第2列)字符串,该字符串不包含"abc"
测试用例1==>111 abc 222(不符合)
测试用例2==>111 xabc 222(不符合)
测试用例3==>111 abcy 222(不符合)
测试用例4==>111 xabcy 222(不符合)
测试用例5==>111 xyz 222(符合)
二、零宽断言
上述问题都可以采用零宽断言来解决,先了解零宽断言:
1.(?=exp):这个零宽断言用来断言自身出现的位置之后能够匹配到表达式exp,考虑下面这一个正则表达式q(?=u),这个正则表达式表示匹配后面的字符是u的q
2.(?!exp):这个零宽断言用来断言自身出现的位置之后不能够匹配到表达式exp,看下面这一个正则表达式q(?!u),这个正则表达式表示匹配后面的字符不是u的q
3.(?<=exp):这个零宽断言用来断言自身出现的位置之前能够匹配到表达式exp
4.(?<!exp):这个零宽断言用来断言自身出现的位置之前不能够匹配到表达式exp
三、程序
1.找出不包含"abc"的字符串
第一步:^(.)+$(字符串构成)
第二步:^((?!abc).)+$(每个字符前的光标位置往后字符串都不能是abc)
use strict; my @lines = ('abc','xabc','abcy','xabcy','xxxx xabcy','xxx abcy dabc','abcy','xyz'); my $pattern = '^((?!abc).)+$'; foreach my $line (@lines) { if ($line =~ /$pattern/) { print "$line:matched,$1/n"; } else { print "$line:mismatched/n"; } }
结果:
abc:mismatched
xabc:mismatched
abcy:mismatched
xabcy:mismatched
xxxx xabcy:mismatched
xxx abcy dabc:mismatched
abcy:mismatched
xyz:matched,z
2.截出指定位置(第2列)字符串,该字符串不包含"abc"
第一步:/S+/s+((/S)+)/s+/S+(先提出第二列)
第二步:/S+/s+(((?!abc)/S)+)/s+/S+(第二列的每个字符前的光标位置往后字符串都不能是abc)
my @lines = ('111 abc 222','111 xabc 222','111 abcy 222','111 xabcy 222','111 xyz 222'); my $pattern = '^/S+/s+(((?!abc)/S)+)/s+/S+$'; foreach my $line (@lines) { if ($line =~ /$pattern/) { print "$line:matched,$1,$2,$3/n"; } else { print "$line:mismatched/n"; } }
D:/temp/perl>perl test.pl
abc:mismatched
xabc:mismatched
abcy:mismatched
xabcy:mismatched
xxxx xabcy:mismatched
xxx abcy dabc:mismatched
abcy:mismatched
xyz:matched,z
参考了:使用零宽断言来匹配不包含连续字符串的行http://www.khotyn.com/category/programming/page/2/