python中re模块的span,详解Python正则表达式re模块

正则是处理字符串最常用的方法,我们编码中到处可见正则的身影。

正则大同小异,python 中的正则跟其他语言相比略有差异:

1、替换字符串时,替换的字符串可以是一个函数

2、split 函数可以指定分割次数,这会导致有个坑

3、前项界定的表达式必须定长

下面详细描述下 re 模块的使用方法,其实,注意上面提到的三点差异就好

1、match

说明:

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回 None。

语法:

re.match(pattern, string, flags=0)

flags为可选标识,多个标识可以通过按位或 (|) 来指定。如 re.I | re.M 被设置成 I 和 M 标识:

修饰符

描述

re.I

使匹配对大小写不敏感

re.L

做本地化识别(locale-aware)匹配

re.M

多行匹配,影响 ^ 和 $

re.S

使 . 匹配包括换行在内的所有字符

re.U

根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.

re.X

该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。

匹配成功re.match方法返回一个匹配的对象,可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。group() 或 group(0),返回整个正则表达式的匹配结果。

举例:

s= 'abc123abc'

print(re.match('[a-z]+', s))           # <_sre.sre_match object span="(0," match="abc">

print(re.match('[a-z]+', s).group(0))      # abc

print(re.match('[\d]+', s))            # None

print(re.match('[A-Z]+', s, re.I).group(0))   # abc

print(re.match('[a-z]+', s).span())       # (0, 3)

2、search

说明:

re.search 扫描整个字符串并返回第一个成功的匹配。

语法:

re.search(pattern, string, flags=0)

匹配成功re.search方法返回一个匹配的对象,否则返回None。可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。

s = 'abc123abc'

print(re.search('[a-z]+', s).group())  # abc

print(re.search('[a-z]+', s).span())   # (0, 3)

print(re.search('[\d]+', s).group())   # 123

print(re.search('[\d]+', s).span())   # (3, 6)

print(re.search('xyz', s))         # None

groupdict

groupdict 返回匹配到的所有命名子组的字典。

print(re.search('[a-z]+', s).groupdict()) # {}

print(re.search('(?P[a-z]+)(?P\d+)', s).groupdict()) # {'num': '123', 'letter': 'abc'}

3、sub 和 subn

说明:

re.sub用于替换字符串中的匹配项。

re.subn返回一个元组,包含替换后的字符串及替换次数。

语法:

sub(pattern, repl, string, count=0, flags=0)

repl: 替换的字符串,也可为一个函数。

count: 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。

举例:

s = 'abc123abc'

print(re.sub('[\d]+', '数字', s)) # abc数字abc

print(re.sub('[a-z]+', '字母', s, 1)) # 字母123abc

# 将匹配的数字乘以 2

def double(matched):

value = int(matched.group('value'))

return str(value * 2)

# repl是一个函数

print(re.sub('(?P\d+)', double, s))  # abc246abc

print(re.subn('[\d]+', '数字', s))       # ('abc数字abc', 1)

print(re.subn('[a-z]+', '字母', s,))      # ('字母123字母', 2)

print(re.subn('[a-z]+', '字母', s, 1))     # ('字母123字母', 1)

4、compile

说明:

re.compile 用于编译正则表达式,生成一个正则表达式(Pattern)对象,供 match() 和 search() 这两个函数使用。

语法:

compile(pattern, flags=0)

举例:

s = 'abc123abc'

p = re.compile('[\d]+')

print(p.match(s, 4, 5).group(0)) # 2 从位置4开始匹配到位置5

print(p.search(s).group(0)) # 123

5、findall

说明:

re.findall 在字符串中查找正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

语法:

findall(pattern, string, flags=0)

举例:

s = 'abc123abc'

print(re.findall('[a-z]+', s)) # ['abc', 'abc']

print(re.findall('[h-n]+', s)) # []

6、finditer

说明:

finditer和 findall 类似,在字符串中查找正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

语法:

finditer(pattern, string, flags=0)

举例:

s = 'abc123def'

it = re.finditer('[a-z]+', s)

for match in it:

print(match.group())

7、split

说明:

re.split 方法按照能够匹配的子串将字符串分割后返回列表。

语法:

split(pattern, string, maxsplit=0, flags=0)

maxsplit:分隔次数,maxsplit=1 分隔一次,默认为 0,不限制次数。

举例:

print(re.split('a', '1A1a2A3', re.I)) # ['1A1', '2A3']

# 输出结果并未能区分大小写,这是因为re.split(pattern,string,maxsplit, flags)默认是四个参数,当我们传入的三个参数的时候,系统会默认re.I是第三个参数,所以就没起作用。

# 如果想让这里的re.I起作用,写成flags=re.I即可。

print(re.split('a', '1A1a2A3', flags=re.I)) # ['1', '1', '2', '3']

8、escape

说明:

re.escape对字符串里面的特殊字符串进行转义。

语法:

escape(pattern)

举例:

print(re.escape('www.dxy.cn')) # www\.dxy\.cn

9、正则

“(?P…)”:分组,并将其命名为。

“(?P=name)”:引用别名为的分组匹配到的串。

10、前项(否定)界定中的特殊

正则中常用的前项界定(?<=exp)和前项否定界定(?

(?<=aaa)   # 正确

(?<=aaa|bbb) # 正确

(?<=aaa|bb) # 错误

(?<=\d+)   # 错误

(?<=\d{3})  # 正确

以上所述是小编给大家介绍的Python正则表达式re模块详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对聚米学院网站的支持!

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python通过re模块的相应方法来支持正则表达式的匹配、查找和替换等功能。你可以使用re模块的fullmatch方法来进行全匹配。 关于正则表达式的写法,通常情况下可以省略正则表达式前面的^和后面的$。^用于匹配字符串的开头,$用于匹配字符串的结尾。如果省略^,则表示匹配任意位置的字符串,如果省略$,则表示匹配包含指定模式的字符串。因此,省略^和$可以获得更灵活的匹配结果。 对于正则表达式案例的编程语言排行,具体的正则表达式写法可以根据具体需求来确定。例如,可以使用正则表达式r'\bpython\b'来匹配单独的"python"单词。其,\b表示单词的边界。这样可以避免匹配到其他包含"python"的字符串。 总而言之,正则表达式是描述特征并验证字符串是否符合这个特征的工具。在Python,可以使用re模块的方法来支持正则表达式的应用。具体的正则表达式写法可以根据需求来确定。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Python正则表达式实例详解](https://blog.csdn.net/wads23456/article/details/115708526)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [详解Python正则表达式(含丰富案例)](https://blog.csdn.net/Dream_Gao1989/article/details/123440771)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值