正则表达式
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配,Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。
一、入门:
1、基本常用的符号对应正则表达式含义:
字符 | 描述 |
---|---|
^ | 匹配输入字符串的开始位置 |
\ | 将下一个字符标记为特殊字符、或原义字符、或向后引用 |
$ | 匹配输入字符串的结束位置 |
* | 匹配前面的子表达式任意次数(包括零次)(贪婪模式) |
+ | 匹配前面的子表达式一次或多次 |
? | 匹配字符的条件(非贪婪) 匹配前面的子表达式零次或一次 |
[xyz] | 字符集合。匹配所包含的任意一个字符 |
[a-z] | 字符范围。匹配指定范围内的任意字符 |
\d | 匹配一个数字字符。等价于 [0-9] |
\D | 匹配一个非数字字符。等价于 [ ^0-9] |
\w | 匹配包括下划线的任何单词字符。等价于’[A-Za-z0-9_]’ |
\W | 匹配任何非单词字符。等价于 ‘[ ^A-Za-z0-9_]’ |