python正则表达式验证码_python re正则表达式模块及其用法

本文详细介绍了Python的re模块,包括其主要函数如`match()`、`search()`、`compile()`等的用法,以及正则表达式的匹配标志。通过实例展示了如何使用正则表达式进行字符串匹配、查找和替换操作,强调了预编译正则表达式以提高性能的重要性。
摘要由CSDN通过智能技术生成

原标题:python re正则表达式模块及其用法

正则表达式(Regular Expression)用于描述一种字符串匹配的模式,它可用于检查一个字符串是否含有某个子串,也可用于从字符串中提取匹配的子串,或者对字符串中匹配的子串执行替换操作。

实际上,掌握 Python 的正则表达式并不难,无非就是几个简单的函数。在 Python 的交互式解释器中先导入 re 模块,然后输入 re.__all__ 命令,即可看到该模块所包含的全部属性和函数:

>>> re.__all__

['match', 'fullmatch', 'search', 'sub', 'subn', 'split', 'findall', 'finditer', 'compile', 'purge', 'template',

'escape', 'error', 'A', 'I', 'L', 'M', 'S', 'X', 'U', 'ASCII', 'IGNORECASE', 'LOCALE', 'MULTILINE', 'DOTALL',

'VERBOSE', 'UNICODE']

从上面的输出结果可以看出,re 模块包含了为数不多的几个函数和属性(用于控制正则表达式匹配的几个选项)。下面先介绍这些函数的作用:

re.compile(pattern, flags=0):该函数用于将正则表达式字符串编译成 _sre.SRE_Pattern 对象,该对象代表了正则表达式编译之后在内存中的对象,它可以缓存并复用正则表达式字符串。如果程序需要多次使用同一个正则表达式字符串,则可考虑先编译它。

该函数的 pattern 参数就是它所编译的正则表达式字符串,flags 则代表了正则表达式的匹配旗标。编译得到的 _sre.SRE_Pattern 对象包含了 re 模块中绝大部分函数对应的方法。比如下面两行代码表示先编译正则表达式,然后调用正则表达式的 search() 方法执行匹配:

#先编译正则表达式

p = re.compile('abc')

#调用_sre.SRE_Pattern 对象的search()方法

p.search("www.abc.com")

上面两行代码和下面代码的效果基本相同:

#直接用正则表达式匹配目标字符串

re.search('abc','www.abc.com')

对于上面两种方式,由于第一种方式预编译了正则表达式,因此程序可复用 p 对象(该对象缓存了正则表达式字符串),所以具有更好的性能。re.match(pattern, string, flags=0):尝试从字符串的开始位置来匹配正则表达式,如果从开始位置匹配不成功,match() 函数就返回 None 。其中 pattern 参数代表正则表达式;string 代表被匹配的字符串;flags 则代表正则表达式的匹配旗标。该函数返回 _sre.SRE_Match 对象,该对象包含的 span(n) 方法用于获取第 n+1 个组的匹配位置,group(n) 方法用于获取第 n+1 个组所匹配的子串。re.search(pattern, string, flags=0):扫描整个字符串,并返回字符串中第一处匹配 pattern 的匹配对象。其中 pattern 参数代表正则表达式;string 代表被匹配的字符串;flags 则代表正则表达式的匹配旗标。该函数也返回 _sre.SRE_Match 对象。

根据上面介绍不难发现,match() 与 search() 的区别在于,match() 必须从字符串开始处就匹配,但 search() 可以搜索整个字符串。例如如下程序:

import re

m1 = re.match('www', 'www.fkit.org')# 开始位置可以匹配

print(m1.span()) # span返回匹配的位置

print(m1.group()) # group返回匹配的组

print(re.match('fkit', 'www.fkit.com')) # 开始位置匹配不到,返回None

m2 = re.search('www', 'www.fkit.org') # 开始位置可以匹配

print(m2.span())

print(m2.group())

m3 = re.search('fkit', 'www.fkit.com') # 中间位置可以匹配,返回Match对象

print(m3.span())

print(m3.group())

运行上面程序,可以看到如下输出结果:

(0, 3)

www

None

(0, 3)

www

(4, 8)

fkit

原文至:https://www.py.cn/jishu/jichu/10535.html返回搜狐,查看更多

责任编辑:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值