前文链接:正则表达式系列 一
本文介绍的是正则的各种性质,有阅读难度,建议先阅读前文
括号
这里讲的括号特指小括号。
分组作用
最直白的含义,即将一部分元素括起来视为一个整体。
#python
re.search(r"^ab+$","abab") != None #False,即无法匹配
re.search(r"^(ab)+$","abab") != None #True,可以匹配
ab+的含义是匹配一个字符a开头,后面跟1个或多个字符b的字符串。所以不能匹配(注意用^和$限制匹配范围)
(ab)+的含义是匹配一个或多个字符串“ab”,所以能匹配
多选分支
这个能力需要借助元字符“|”,表示“或”的含义
#python
regex = r"^([a-zA-Z]+|[0-9]+)$"
re.search(regex, "19987234") != None #True
re.search(regex, "cajsdioc") != None #True
re.search(regex, "89dsa") != None #False
regex
中含有两个字符组,[a-zA-Z]+
匹配一个纯字母的字符串,[0-9]+
匹配一个纯数字的字符串。二者用或相连。所以既能匹配纯数字串,也能匹配纯字母串,但无法匹配混杂字母和数字的字符串
多选分支还有一些注意事项
-
多选分支也可以没有括号。因为元字符“|”的运算优先级非常低。
ab|cd和(ab|cd)
的效果完全相同 -
能用字符组实现的功能,不要用多选分支,因为相同情况下多选分支效率差得多
-
多选分支的排列顺序,大部分语言是优先匹配靠左的分支条件。所以如果写出的两个分支能匹配同一个字符串,最后匹配结果是靠左的分支。
#python re