在前面使用了分组的模式来匹配正则表达式,比如'a((a+)|(b+))'的分组功能,就会产生三组值返回,如下:
'a((a+)|(b+))' (capturing form)
'abbaabbba'
'abb' ('bb', None, 'bb')
'aa' ('a', 'a', None)
第一组((a+)|(b+))是匹配第一组返回 'bb', 第二组(a+)匹配返回None, 第三组(b+)返回'bb'。
有时我们只想需要第一组的结果,后面第二组和第三组不要返回,也就是把None和'bb'丢掉,怎么办呢?也许有同学说,直接把后面的组去掉不就行了吗?显然不行的,因为需要匹配过程,但结果不要,如果不要后面的分组就达不到匹配了。其实这种情况,就是只要过程不要结果,不希望匹配结果返回来。因此,需要使用一种新的语法:(?:pattern)。使用?:之后这个组的正则表达式只负责匹配,但不返回结果。用下面的例子来测试一下:
深入浅出Numpy
五子棋游戏开发
http://edu.csdn.net/course/detail/5487
'a((a+)|(b+))' (capturing form)
'abbaabbba'
'abb' ('bb', None, 'bb')
'aa' ('a', 'a', None)
第一组((a+)|(b+))是匹配第一组返回 'bb', 第二组(a+)匹配返回None, 第三组(b+)返回'bb'。
有时我们只想需要第一组的结果,后面第二组和第三组不要返回,也就是把None和'bb'丢掉,怎么办呢?也许有同学说,直接把后面的组去掉不就行了吗?显然不行的,因为需要匹配过程,但结果不要,如果不要后面的分组就达不到匹配了。其实这种情况,就是只要过程不要结果,不希望匹配结果返回来。因此,需要使用一种新的语法:(?:pattern)。使用?:之后这个组的正则表达式只负责匹配,但不返回结果。用下面的例子来测试一下:
#python 3.6
#蔡军生
#http://blog.csdn.net/caimouse/article/details/51749579
#
from re_test_patterns_groups import test_patterns
test_patterns(
'abbaabbba',
[(r'a((a+)|(b+))', 'capturing form'),
(r'a((?:a+)|(?:b+))', 'noncapturing')],
)
结果输出如下:
'a((a+)|(b+))' (capturing form)
'abbaabbba'
'abb' ('bb', None, 'bb')
'aa' ('a', 'a', None)
'a((?:a+)|(?:b+))' (noncapturing)
'abbaabbba'
'abb' ('bb',)
'aa' ('a',)
比较捕获模式和非捕获模式时,就会发现第二个结果比第一个少后面组返回,达到了目标。