1.正则化表达式
常用的元字符:
代码 | 说明 |
. | 匹配除换行符以外的任意字符 |
\w | 匹配字符或数字或下划线或汉字等 |
\s | 匹配任意的空白符,包括空格,制表符(tab),换行符,中文全角空格等 |
\d | 匹配数字 |
\b | 匹配单词的开始或结束 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
常用的限定词:
代码/语法 | 说明 |
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |
常用的反义代码:
代码/语法 | 说明 |
\W | 匹配任意不是字母、数字、下划线、汉字的字符 |
\S | 匹配任意不是空白符的字符 |
\D | 匹配任意非数字的字符 |
\B | 匹配不是单词开头或结束的位置 |
[^x] | 匹配除了x以外的任意字符 |
[^aeiou] | 匹配除了aeiou这几个字母以外的任意字符 |
详细讲解见:https://deerchao.cn/tutorials/regex/regex.htm
2.re.findall()函数
查找所有
re.findall(pattern, string, flags=0)
参数说明:
pattern: 正则表达式
string:需要处理的字符串
flag:说明匹配模式,如:是否区分大小写等。
3.re.match()函数
尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
re.match(pattern, string, flags=0)
参数说明:
pattern: 匹配的正则表达式
string:要匹配的字符串
flag:标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等。
详细见:https://www.runoob.com/python/python-reg-expressions.html