正则匹配的巧妙用法
发现一个正则匹配的巧妙用法,记录在这里,以后有需要的话记得用上它吧。
在正则匹配的表达式中我们会经常用到下面几个匹配符号:
\s,\S,\d,\D,\w,\W, 单独使用其中的一种这是最平常普通的用法了这里就不做说明了。
想要说明的另一种用法就是成对儿的使用它们时会达到意想不到的效果。
举个例子说明一下:
undef $/;
open(A,"file");
while(<A>){
s/\s*aaa[\s\S]+?bbb(?=\s*ccc)//g;
print;
}
上面脚本的目的是将文件中aaa的位置开始一直到bbb之间的所有字符删除掉,
并且还用到了向后预搜索的方式(?=...),只有右边有ccc字符的bbb才是其要匹配的位置,
中间的[\s\S]就是代表了任何字符,包括换行符,实际上[\S]就是[\s]的补集嘛,
这两个字符在一个[]中就能匹配了所有特殊字符了,后面在加上+?的非贪婪匹配模式
就更加完美了。
同理,不止是[\s\S]可以代表任何字符了,[\d\D],[\w\W]都可以代表了,此处方法一样。
发现一个正则匹配的巧妙用法,记录在这里,以后有需要的话记得用上它吧。
在正则匹配的表达式中我们会经常用到下面几个匹配符号:
\s,\S,\d,\D,\w,\W, 单独使用其中的一种这是最平常普通的用法了这里就不做说明了。
想要说明的另一种用法就是成对儿的使用它们时会达到意想不到的效果。
举个例子说明一下:
undef $/;
open(A,"file");
while(<A>){
s/\s*aaa[\s\S]+?bbb(?=\s*ccc)//g;
print;
}
上面脚本的目的是将文件中aaa的位置开始一直到bbb之间的所有字符删除掉,
并且还用到了向后预搜索的方式(?=...),只有右边有ccc字符的bbb才是其要匹配的位置,
中间的[\s\S]就是代表了任何字符,包括换行符,实际上[\S]就是[\s]的补集嘛,
这两个字符在一个[]中就能匹配了所有特殊字符了,后面在加上+?的非贪婪匹配模式
就更加完美了。
同理,不止是[\s\S]可以代表任何字符了,[\d\D],[\w\W]都可以代表了,此处方法一样。