在此之前学习的正则表达式元字符只能匹配显示一次字符或字符串,如果想匹配显示多次字符或字符串可以使用量词。
13.3.1 量词的使用
量词表示字符或字符串重复的次数,正则表达式中的量词如表所示:
字符 | 说明 |
---|---|
? | 出现零次或一次 |
* | 出现零次或多次 |
+ | 出现一次或多次 |
{n} | 出现零次或n次 |
{n,m} | 至少出现n次但不超过m次 |
{n,} | 至少出现n次 |
示例代码:
import re
# 出现数字一次
m = re.search(r"\d?", "87654321")
# 匹配字符“8”
print(m)
# 出现数字零次
m = re.search(r"\d?", "ABC")
# 匹配字符“”
print(m)
# 出现数字多次
m = re.search(r"\d*", "87654321")
# 匹配字符“87654321”
print(m)
# 出现数字零次
m = re.search(r"\d*", "ABC")
# 匹配字符“”
print(m)
# 出现数字多次
m = re.search(r"\d+", "87654321")
# 匹配字符“87654321”
print(m)
m = re.search(r"\d+", "ABC")
# 不匹配
print(m)
# 出现数字8次
m = re.search(r"\d{8}", "87654321")
# 匹配字符“87654321”
print(m)
m = re.search(r"\d{8}", "ABC")
# 不匹配
print(m)
# 出现数字8次
m = re.search(r"\d{7,8}", "87654321")
# 匹配字符“87654321”
print(m)
m = re.search(r"\d{9,}", "87654321")
# 不匹配
print(m)
执行结果:
<re.Match object; span=(0, 1), match='8'>
<re.Match object; span=(0, 0), match=''>
<re.Match object; span=(0, 8), match='87654321'>
<re.Match object; span=(0, 0), match=''>
<re.Match object; span=(0, 8), match='87654321'>
None
<re.Match object; span=(0, 8), match='87654321'>
None
<re.Match object; span=(0, 8), match='87654321'>
None
13.3.2 贪婪量词和懒惰量词
量词还可以细分为贪婪量词和懒惰量词,贪婪量词会尽可能多地匹配字符,懒惰量词会尽可能少地匹配字符。
大多数计算机语言的正则表达式量词默认是贪婪的,要想使用懒惰量词在量词后面加 “?
” 即可。
示例代码如下:
import re
# 使用贪婪量词,出现数字8次
# 用了贪婪量词{5,8},输入字符串 “87654321” 是长度 8 位的数字字符串
# 尽可能多地匹配字符结果是 “87654321”
m = re.search(r'\d{5,8}', '87654321')
# 匹配字符'87654321'
print(m)
# 使用惰性量词,出现数字5次
# 用惰性量词 {5,8}?,输入字符串 “87654321” 是长度 8 位的数字字符串
# 尽可能少地匹配字符结果是 “87654”
m = re.search(r'\d{5,8}?', '87654321')
# 匹配字符'87654'
print(m)
执行结果:
<re.Match object; span=(0, 8), match='87654321'>
<re.Match object; span=(0, 5), match='87654'>