组在正则表达式里是一个重要概念,用小括号()表示。小括号即是正则表达式的模式;同时它与被括起来的子模式匹配的串匹配,此时小括号就确定了一个被匹配的组。感觉不太好理解,先看下面例子吧。
1.前期准备:
import re # 加载模块
s = 'zvzc zcpython python1234 abcPython' # 字符串
2.模式里没有小括号:
pattern = re.compile('[Pp]ython')
print(pattern.search(s)) # 返回match对象
print(pattern.search(s).group()) # 返回模式匹配的第一个子串
print(pattern.findall(s)) # 返回列表,表中元素是匹配的各子串
#结果如下:
<_sre.SRE_Match object; span=(7, 13), match='python'>
python
['python', 'python', 'Python']
3.1模式里有小括号:
pattern = re.compile('(P|p)ython')
print(pattern.search(s)) # 返回match对象
print(pattern.search(s).group()) # 返回模式匹配的第一个子串
print(pattern.search(s).groups())
# 返回小括号里的内容。就是先匹配整个模式得到子串'python',
# 然后拿得到的子串'python'去匹配小括号里的模式,最后得到'p',并放到元组里
print(pattern.findall(s))
# 返回小括号里的内容。就是先匹配整个模式得到子串'python'和'Python',
# 然后拿得到的子串'python'或'Python'去匹配小括号里的模式,最后得到'p'和'P',并放到列表里
#结果如下:
<_sre.SRE_Match object; span=(7, 13), match='python'>
python
('p',)
['p', 'p', 'P']
3.2模式里有两层小括号:
pattern = re.compile('((P|p)ython)')
print(pattern.search(s)) # 返回match对象
print(pattern.search(s).groups())
# 先得到外层小括号匹配的子串'python',
# 再拿得到的子串'python'去匹配小括号里的模式,得到'p'子串,最后把两个子串放到元组里,并返回。
print(pattern.findall(s))
# 先得到外层小括号匹配的子串'python'和'Python',
# 再拿得到的子串'python'和'Python'去匹配小括号里的模式,得到'p'和'P'子串,最后把两个子串放到元组里,作为元素存入列表并返回。
# 结果如下:
<_sre.SRE_Match object; span=(7, 13), match='python'>
('python', 'p')
[('python', 'p'), ('python', 'p'), ('Python', 'P')]