python re sub用法_python re模块常见使用方法整理

6f5ca74559e39ef94fd1539ddea3e449.png

我们在用re模块时,根据不同的使用需求,我们要挑选不同的函数来匹配。考虑到大家初学python,在对于方法的学习上,小编推荐以常见的方法为主要学习目标。本篇所带来的是re.sub和re.compile两种函数,下面就这两个部分分别展开讲解,具体内容如下展开。

1、re.sub

re.sub用于替换字符串中的匹配项。下面一个例子将字符串中的空格 ' ' 替换成 '-' :import re

text = "JGood is a handsome boy, he is cool, clever, and so on..."

print re.sub(r'/s+', '-', text)

import re text = "JGood is a handsome boy, he is cool, clever, and so on..." print re.sub(r'/s+', '-', text)

re.sub的函数原型为:re.sub(pattern, repl, string, count)

其中第二个函数是替换后的字符串;本例中为'-'

第四个参数指替换个数。默认为0,表示每个匹配项都替换。

re.sub还允许使用函数对匹配项的替换进行复杂的处理。如:re.sub(r'/s', lambda m: '[' + m.group(0) + ']', text, 0);将字符串中的空格' '替换为'[ ]'。

2、re.compile

可以把正则表达式编译成一个正则表达式对象。可以把那些经常使用的正则表达式编译成正则表达式对象,这样可以提高一定的效率。下面是一个正则表达式对象的一个例子:import re

text = "JGood is a handsome boy, he is cool, clever, and so on..."

regex = re.compile(r'/w*oo/w*')

print regex.findall(text)   #查找所有包含'oo'的单词

print regex.sub(lambda m: '[' + m.group(0) + ']', text) #将字符串中含有'oo'的单词用[]括起来。

import re text = "JGood is a handsome boy, he is cool, clever, and so on..." regex = re.compile(r'/w*oo/w*') print regex.findall(text) #查找所有包含'oo'的单词 print regex.sub(lambda m: '[' + m.group(0) + ']', text) #将字符串中含有'oo'的单词用[]括起来。

以上就是python re模块常见使用方法整理,当然re模块的方法比较多,本篇因为篇幅有限,会在之后的文章中不断更新这部分的使用。更多Python学习指路:

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python re sub函数是re模块中的字符串替换函数,可以用来快速、高效地实现字符串的替换操作。其常用的替换方式是通过正则表达式匹配需要替换的子串,然后通过替换函数将其替换为指定的字符串。 Python re sub函数还具有一些高级用法,以下是一些实例: 1. 可以使用‘\g’来引用捕获组中的内容,例如: ```python import re # 将“年-月-日”的日期格式转换为“月/日/年”格式 text = "2020-09-01" res = re.sub(r'(\d{4})-(\d{2})-(\d{2})', r'\2/\3/\1', text) print(res) # 输出:09/01/2020 ``` 在这个例子中,通过正则表达式匹配了“年-月-日”这个格式的日期字符串,并且使用‘\g’指定了要替换的顺序。其中,‘\1’表示要在替换后放在第一个位置的字符串,‘\2’表示要在替换后放在第二个位置的字符串,以此类推。 2. 可以使用函数作为替换字符,例如: ```python import re # 将所有字符替换成它们的ASCII编码,例如“A”替换成“65” text = "Hello World" res = re.sub(r'.', lambda m: str(ord(m.group(0))), text) print(res) # 输出:72 101 108 108 111 32 87 111 114 108 100 ``` 在这个例子中,我们使用了一个lambda函数作为替换字符,将每个匹配到的字符替换成它的ASCII编码。 3. 可以使用命名捕获组来引用内容,例如: ```python import re # 将“年-月-日”的日期格式转换为“月/日/年 Hour:Minute:Second”格式 text = "2020-09-01 16:20:00" res = re.sub(r'(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2}) (?P<hour>\d{2}):(?P<minute>\d{2}):(?P<second>\d{2})', r'\g<month>/\g<day>/\g<year> \g<hour>:\g<minute>:\g<second>', text) print(res) # 输出:09/01/2020 16:20:00 ``` 在这个例子中,我们使用了命名捕获组来引用捕获组中的内容,例如'(?P<year>\d{4})'表示匹配四位数的年份,并且使用“year”作为捕获组的名称。在替换字符中,我们使用‘\g’来引用捕获组的名称,并且按照指定的顺序进行替换。 总之,Python re sub函数具有丰富的替换功能,可以根据具体的需求选择不同的替换方式来实现字符串的高效处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值