python基础操作——正则表达式

一、匹配单个字

表达式含义
\d匹配一个数字,等价于0-9之间的任意一个数字,通过[数字]/[起始数字-结尾数字]可以具体指定匹配数字的范围
\w 匹配单词字符,即a-z、A-Z、0-9、_
\W大写W匹配非单词字符
.匹配任意1个字符(除了\n)
[]匹配[]中列举的字符
\D匹配非数字,即不是数字
\s匹配空白,即空白,tab键
\S匹配非空白

[0123456789]    == [0-9]
[123678]    ==     [1-36-8]
字母同样的逻辑处理:[a-z],表示匹配a到z之间的任意一个字母

二、匹配多个字符

通过{数字}来限制需要匹配的特定内容出现的次数,例如match(r'数字\d{2}', '数字123'),表示匹配“数字”后面有两个数字的字符串,如果超
出指定的范围,取到范围处为止,如果不够指定范围长度,则报错
match(r'内容\d{1,2}','内容12'),表示匹配'内容后面有一个或两个数字的字符串',如果超出指定的范围,则按最大范围取匹配内容
*   匹配前一个字符出现0次或者无限次,即可有可无
+   匹配前一个字符出现1次或者无限次,即至少有1次
?   匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m}  匹配前一个字符出现m次
{m,n} 匹配前一个字符出现从m次到n次

 

三、匹配开头结尾

开头:^
结尾:$

 

四、匹配分组

|   匹配左右任意一个表达式
(ab)    将括号中字符作为一个分组
\num    引用分组num匹配到的字符串
(?P<name>)  分组起别名
(?P=name)   引用别名为name分组匹配到的字符串

 

五、re模块高级用法

search:搜索和查询内容相匹配的数据值
re.search(r'\d+', '阅读量 999').group()    会返回999

findall:返回所有和查询内容相匹配的数据值,返回列表
re.findall(r'\d+', 'python=999,c=7890')     会返回[999, 7890]

sub:将匹配到的数据进行替换
re.sub(r'正则匹配规则', '新内容', '数据')  运行原理,会优先进行正则匹配,如果有匹配上的内容就将其替换为新内容

split:根据匹配进行切割字符串,返回一个列表

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值