2021-05-15

本文介绍了Python中re模块的使用,包括正则表达式的编译、match和search函数的区别,以及findall方法在查找字符串匹配上的应用。重点讨论了如何通过正则表达式进行高效的数据查找、替换等操作,对于文本处理和网页爬虫等领域具有实用价值。
摘要由CSDN通过智能技术生成

正则表达式

正则表达式使用某种预定义的模式去匹配一类具有共同特征的字符串,主要用于处理字符串,可以快速、准确地完成复杂的查找、替换等处理要求,在文本编辑与处理、网页爬虫之类的场合中有重要应用。

re模块
Python通过re模块提供对正则表达式的支持。
使用re的一般步骤是先将正则表达式的字符串形式编译为Pattern实例
然后使用Pattern实例处理文本并获得匹配结果(一个Match实例)
最后使用Match实例获得信息,进行其他的操作。

re.match函数
re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None。

re.match(pattern, string, flags=0)

flags在这里插入图片描述
匹配成功re.match方法返回一个匹配的对象
使用group(num)或groups()匹配对象函数来获取匹配表达式。
在这里插入图片描述
re.search方法
re.search 扫描整个字符串并返回第一个成功的匹配

re.search(patternstring,flags=0)

re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None
而re.search匹配整个字符串,直到找到一个匹配。

compile 函数
compile 函数用于编译正则表达式,生成一个正则表达式
(Pattern)对象,供match()和search()这两个函数使用。

re.compile(pattern[,flags])

findall
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
注意:match和search是匹配一次findall 匹配所有。

findall(string[,pos[,endpos]])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值