详解python里使用正则表达式的分组命名方式
分组匹配的模式,可以通过groups()来全部访问匹配的元组,也可以通过group()函数来按分组方式来访问,但是这里只能通过数字索引来访问,如果某一天产品经理需要修改需求,让你在它们之中添加一个分组,这样一来,就会导致匹配的数组的索引的变化,作为开发人员的你,必须得一行一行代码地修改。因此聪明的开发人员又想到一个好方法,把这些分组进行命名,只需要对名称进行访问分组,不通过索引来访问了,就可以避免这个问题。那么怎么样来命名呢?可以采用(?Ppattern)的格式来命名。
例子如下:
#python 3.6
#蔡军生
#http://blog.csdn.net/caimouse/article/details/51749579
#
import re
text = 'This is some text -- with punctuation.'
print(text)
print()
patterns = [
r'^(?P\w+)',
r'(?P\w+)\S*$',
r'(?P\bt\w+)\W+(?P\w+)',
r'(?P\w+t)\b',
]
for pattern in patterns:
regex = re.compile(pattern)
match = regex.search(text)
print("'{}'".format(pattern))
print(' ', match.groups())
print(' ', match.groupdict())
print()
结果输出如下:
This is some text -- with punctuation.
'^(?P\w+)'
('This',)
{'first_word': 'This'}
'(?P\w+)\S*$'
('punctuation',)
{'last_word': 'punctuation'}
'(?P\bt\w+)\W+(?P\w+)'
('text', 'with')
{'t_word': 'text', 'other_word': 'with'}
'(?P\w+t)\b'
('text',)
{'ends_with_t': 'text'}
如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!