正则表达式
regular expression ,regex,RE
正则表达式是用来简洁表达一组字符串的表达式
正则表达式的语法
正则表达式语法由字符和操作符构成
.
表示任何单个字符
[]
字符集,对单个字符给出取值范围 [abc]
表示a、b,c,[a-z]
表示a到z单个字符
```[^ ]``非字符集,对单个字符给出排除范围 [^abc]
表示非a或b或c的单个字符
*
前一个字符0次或无限次扩展 abc*
表示 ab、abc、abcc、abccc等
+
前一个字符1次或无限次扩展 abc+
表示abc,abcc,abccc等
?
前一个字符0次或1次扩展 abc?
表示ab、abc
|
左右表达式任意一个 abc|def
表示abc、def
{m}
扩展前一个字符m次 ab{2}c
表示abbc
{m,n}
扩展前一个字符m至n次(含n)ab{1,2}c
表示abc、abbc
^
匹配字符串开头^abc
表示abc且在一个字符串的开头
$
匹配字符串结尾abc$
表示abc且在一个字符串的结尾
()
分组标记,内部只能使用 |
操作符 abc
表示abc,(abc|def`)
表示abc,def
\d
数字等价于 [0-9]
\w
单词字符,等价于[A-Za-z0-9]
Re库
import re
Re库的Match对象
贪婪匹配与最小匹配