Python模块之re正则表达式

match方法

匹配单个字符
字符功能
.匹配任意1个字符(除了\n)
[ ]匹配[ ]中列举的字符
\d匹配数字,即0-9
\D匹配非数字,即不是数字
\s匹配空白,即 空格,tab键
\S匹配非空白
\w匹配单词字符,即a-z、A-Z、0-9、_
\W匹配非单词字符
匹配多个字符
字符功能
*匹配前一个字符出现0次或者无限次,即可有可无
+匹配前一个字符出现1次或者无限次,即至少有1次
?匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m}匹配前一个字符出现m次 == m
{m, }匹配前一个字符出现 >= m 次
{m, n}匹配前一个字符出现: m次<= 前一个字符 <=n次
匹配开头结尾
字符功能
^匹配字符串开头
$匹配字符串结尾
匹配分组
字符功能
|匹配左右任意一个表达式
(ab)将括号中字符作为一个分组
\num引用分组num匹配到的字符串
(?P<name>)分组起别名
(?P=name)引用别名为name分组匹配到的字符串
r的作用

Python中字符串前面加上 r 表示原生字符串,让程序把正则直接当做正则看(不会从字符串开始解释),有效解决反斜杠转义的问题

贪婪与非贪婪

Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;

非贪婪则相反,总是尝试匹配尽可能少的字符。

贪婪: 量词在范围内,取最多,match方法默认贪婪

print("贪婪", re.match(r"a+", "aaa").group())
输出 贪婪 aaa

非贪婪: 量词在范围内,取最少,只需要在量词后面加一个?

print("非贪婪(量词后面加?)", re.match(r"a+?", "aaa").group())
输出 非贪婪(量词后面加?) a

search方法

查询单个内容,返回的是对象,需要用group()获取内容

print(re.search(r"\d+", "aaa111bbb222ccc333ddd").group())
输出 111

findall方法

查询所有内容,返回的是列表,不需要用group()

print(re.findall(r"\d+", "aaa111bbb222ccc333ddd"))
输出 [111, 222, 333]

sub方法

sub(正则表示替换的条件,替换的字符, 被替换的字符串,替换的次数), 返回一个字符串

print(re.sub(r"\d+", "###", "aaa111bbb222ccc333ddd", 2))
输出 aaa###bbb###ccc333ddd

split方法

split(正则表达式作为分隔符, 被分割的字符串), 返回一个列表

print(re.split(r"\d+", "aaa111bbb222ccc333ddd"))
输出 ['aaa', 'bbb', 'ccc', 'ddd']
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值