最近用到了python里面的re这个library,每次用到的时候有点不明所以,所以还是搜搜资料然后写一下笔记来方便理解和使用吧。
正则表达式这个名词的意思大概就是根据使用规则来提取表达式,也就是说,利用约定的语法规则去提取你想要的东西
以下是基本的一些规则,理解了规则,正则表达式就很清晰了:
等价符: ? * + \d \w
常用运算符与表达式:
^ 从开头开始匹配
() 域段
[] 包含,默认是一个字符长度
[^] 不包含,默认是一个字符长度
{n,n} 匹配长度 可以缺省。
. 任何单个字符(\. 字符点)
| 或
\ 转义
$ 从行尾匹配
[A-Z] 26个大写字母
[a-z] 26个小写字母
[0-9] 0至9数字
[A-Za-z0-9] 26个大写字母、26个小写字母和0至9数字
, 分割
+ 匹配1次或更多
* 匹配0次或更多
? 匹配0次或1次
\d 数字
\w 字母
(?=exp)表示此位置后面可以匹配到exp
(?<=exp)表示此位置前面可以匹配到exp
(?!exp) 表示此位置后面不可以匹配到exp
(?<!exp)表示此位置前面不可以匹配到exp