正则表达式笔记

正则表达式

re模块的sub方法:

import re 
p=re.compile(r'(\w+) (\w+)')
s='hello 123,hello 456,hello 789'
print(p.sub(r'hello world',s))
print(p.sub(r'\2\1',s))
def func(m):
    return 'hi'+' '+m.group(2)
print(p.sub(func,s))
print(p.sub(func,s,1))

运行结果:

hello world,hello world,hello world
123hello,456hello,789hello
hi 123,hi 456,hi 789
hi 123,hello 456,hello 789
Press any key to continue . . .

解释:r'(\w+) (\w+)'代表的模式是一个字符串+空格+一个字符串。由于是贪婪匹配,所以一共匹配三次,每次的group(1)是hello,group(2)就是数字了.
p.sub(func,s,1)的意思是用hi+空格+数字替换原字符串,“1”表示只替换一次.
func调用的时候没有写参数,它接受的是p和s匹配结果的match对象.

re模块的应用:

import re 
# 案例2:
#     北美电话的常用格式:(eg: 2703877865)
#             前3位: 第一位是区号以2~9开头 , 第2位是0~8, 第三位数字可任意;
#             中间三位数字:第一位是交换机号, 以2~9开头, 后面两位任意
#             最后四位数字: 数字不做限制;
pattern2 = r'\(?[2-9][0-8]\d\)?[-\.\s]?[2-9]\d{2}[-\.\s]?\d{4}'
text = '(323)4567890'
patternObj = re.compile(pattern2)
result = patternObj.findall(text)
print(result)

[’(323)4567890’]
Press any key to continue . . .

解释:r'\(?[2-9][0-8]\d\)?[-\.\s]?[2-9]\d{2}[-\.\s]?\d{4}':第一个?表示前括号可以有0-1个,第二个?同理。[2-9][0-8]\d表示前三位数是2-9、0-8和任意。[-.\s]?表示“- . 空格”可以有0-1个

r:代表规则为原生字符串, 一般情况下\代表转义的意思, 如果匹配的规则里面包含\时, 要写成\, 而有了r, 就不用\了.所以r只用于匹配规则中含“\”

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值