1.查找方法
正则表达式的工具包在“re”包里,引入方法是“import re”
re.match()
re.match() 匹配字符串是否以指定的正则内容开头,匹配成功返回对象,匹配失败返回None
这里有三个参数:
- 参数1:正则表达式
- 参数2:要验证的字符串
- 参数3:可选参数,正则表达式的修饰符
re.search()
re.search()匹配字符串中是否包含指定的内容,匹配成功返回对象,匹配失败返回None
2.字符和特殊字符
- \d:匹配数字,0-9之间任意的数字 等同于[0-9]
- [^0-9]:匹配所有的非数字字符
- \D:匹配非数字字符,可以理解为对\d取反
- \w:匹配字母、数字、下划线 等同于[0-9a-zA-Z]
- \w(大写):匹配非数字\字母\下划线[^0-9a-zA-Z]
- \s:匹配任意的空白字符(空格、回车、换行、制表符、换页)等同于[\r \n \t \f]
- \S(大写):匹配任意的非空白字符(空格、回车、换行、制表符、换页)等同于[^\r \n \t \f]
- [ ]:匹配括号内的一位
- -:一个区间
- .:匹配除了换行符以外的任意字符
3.模式修正符
模式修饰符主要用于修饰正则表达式,是一个可选参数
- .:匹配除了换行外的所有字符 \n表示换行
- re.S(大写):可以使"."匹配"\n"
- re.I(大写):可以使[a-z]原本匹配小写字母的部分匹配大写字母,使正则表达式忽略大小写
4.匹配多个字符
- ?:表示前面的字符可以出现0次或1次
- +:表示前面的字符可以出现1次或多次
- *:表示前面的字符可以出现0次或多次
-
{}:表示前面的字符可以出现指定的次数或者是次数的范围 {3}前面的字符只能出现三次 {3,6}前面的字符只能出现3-6次 {3,}前面的字符至少出现3次 {,3}前面的字符最多出现3次
5.边界字符
- ^:行首匹配,以指定字符开头
- $:行尾匹配,以指定字符结尾
- ^文本$:完全匹配
6.其他功能函数
- 拆分:re.split(正则表达式,“要处理的数据”)
- 替换:re.sub(正则表达式,"要替换后的内容,"要处理的数据")
- 匹配中文