-
导入:
- import re
-
正则方法:
-
全局函数使用格式:
-
re.compile(‘要匹配的字符’,re.S).findall(‘字符’)建议加入re.S 返回列表包含元素
-
如果匹配不到不会报错会返回一个空列表
-
-
基础1:
- 普通字符 正常匹配
- \n 匹配换行符
- \t 匹配制表符
- \w 匹配数字,下划线,字母
- \W 匹配除字母,数字,下划线
- \d 匹配十进制数字
- \D 匹配除十进制数字
- \s 匹配空白字符
- \S 匹配非空白字符
- [ab89x] 原子表,匹配ab89x中的任意一个
- [^ab89x] 原自表,匹配除ab89x以外的任意一个字符
-
基础2
- . 匹配除换行外任意一个字符
- ^ 匹配开始位置
- $ 匹配结束为置
- * 前一个字符出现0\1\多次
- ? 前一个字符出现0\1次
- + 前一个字符出现1\多次
- {n} 前一个字符恰好出现n次
- {n,} 签一个字符至少n次
- {n,m} 前一个字符至少n,至少m次
- | 模式选择符
- () 模式单元,通俗来说就是,想提取出什么内容,就在正则中用小括号将其括起来
-
基础3
- 贪婪模式:尽可能多的匹配
- 懒惰模式:尽可能少的匹配,精准模式
- 默认贪婪模式:
- 如果出现如下组合,则代表为懒惰模式
- *?
-
-
默认贪婪模式:
- 如果出现如下组合,则代表为懒惰模式
- *?
- +?
re使用
最新推荐文章于 2024-04-10 20:09:48 发布