正则表达式,又称规则表达式。计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
1. *表示0个或者多个在*字符之前的那个普通字符
hel*o,可以匹配hello或者helllllo,
2. .匹配任意字符:...73.可以匹配xxx73x
3. ^匹配行首或者后面字符的非
4. &匹配行尾:^&表示空行,^.&表示任意行
5. []表示匹配字符集合,也可以是范围,支持穷举,也支持“-”符号表示字符集合范围,例:[012345],[0-5]是一样的。^[^b-p]表示除了b-p之外的所有字符
6. \< \>表示精确匹配符号:例:\<the\>表示只匹配the这个单词,并不是含有the这个单词的句子
7. \{n\}:表示匹配前面的字符出现n次
8. \{n,\}:表示匹配前面的字符至少出现n次
9. \{n,m}:表示匹配前面的字符出现n到m次
10. ?表示匹配前面的字符出现零次或者一次,等价于{0,1}
11. +表示匹配前面的字符出现一次或者多次,等价于{1,}
12. ()表示一个字符集
13. |为或者:re(a|e|o)d可以匹配:read reed reod:相当于re[aeo]d