《零基础学python》---第五章 字符串及正则表达式(3,使用re模块实现正则表达式操作)

python提供了re模块,用于实现正则表达式的操作。在实现时,可以使用re模块提供的方法(如search()、match()、findall()等)进行字符串处理,也可以使用re模块的compile()方法将模式字符串转换为正则表达式对象,然后再使用该正则表达式对象的相关方法来操作字符串。

匹配字符串

1.使用match()方法进行匹配
match()方法用于从字符串的开始处进行匹配,如果在起始位置匹配成功,则返回Match对象,否则返回None。其语法格式如下:

re.match(pattern,string,[flags])

pattern:表示模式字符串,由要匹配的正则表达式转换而来。
string:表示要匹配的字符串。
flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

>>> import re
>>> pattern = r'mr_\w+'                          #模式字符串
>>> string = 'MR_SHOP mr_shop'                   #要匹配的字符串
>>> match = re.match(pattern,string,re.I)        #匹配字符串,不区分大小写
>>> print(match)                                 #输出匹配结果
<re.Match object; span=(0, 7), match='MR_SHOP'>
>>> string = '项目名称MR_SHOP mr_shop'            
>>> match = re.match(pattern,string,re.I)        #匹配字符串,不区分大小写
>>> print(match)                                 #输出匹配结果
None 

2.使用search()方法进行匹配
search()方法用于在整个字符串中搜索第一个匹配的值,如果匹配成功,则返回Match对象,否则返回None。search()方法的语法格式如下:

re.search(pattern,string,[flags])

pattern:表示模式字符串,由要匹配的正则表达式转换而来。
string:表示要匹配的字符串。
flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

>>> import re
>>> pattern = r'mr_\w+'                         #模式字符串
>>> string = 'MR_SHOP mr_shop'                  #要匹配的字符串
>>> match = re.search(pattern,string,re.I)      #匹配字符串,不区分大小写
>>> print(match)                                #输出匹配结果
<re.Match object; span=(0, 7), match='MR_SHOP'>
>>> string = '项目名称MR_SHOP mr_shop'
>>> match = re.search(pattern,string,re.I)      #匹配字符串,不区分大小写
>>> print(match)                                #输出匹配结果
<re.Match object; span=(4, 11), match='MR_SHOP'>

search()方法不仅仅是在字符串的起始位置搜索,其他位置有符合的匹配也可以进行搜索
3.使用findall()方法进行匹配
findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,并以列表的形式返回。如果匹配成功,则返回包含匹配结构的列表,否则返回空列表。findall()方法的语法格式如下:

re.findall(pattern,string,[flags])

pattern:表示模式字符串,由要匹配的正则表达式转换而来。
string:表示要匹配的字符串。
flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

>>> import re
>>> pattern = r'mr_\w+'                        #模式字符串
>>> string = 'MR_SHOP mr_shop'                 #要匹配的字符串
>>> match = re.findall(pattern,string,re.I)    #匹配字符串,不区分大小写
>>> print(match)                               #输出匹配结果
['MR_SHOP','mr_shop']
>>> string = '项目名称MR_SHOP mr_shop'
>>> match = re.search(pattern,string,re.I)     #匹配字符串,不区分大小写
>>> print(match)                               #输出匹配结果
['mr_shop'] 

替换字符串

sub()方法用于实现字符串替换,语法格式如下:

re.sub(pattern,repl,string,count,flags)

pattern:表示模式字符串,由要匹配的正则表达式转换而来。
repl:表示要替换的字符串。
string:表示要被查找替换的原始字符串。
count:可选参数,表示模式匹配后替换的最大次数,默认为0,表示替换所有的匹配。
flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

>>> import re
>>> pattern =r'1[34578]\d{9}'
>>> string = '中奖号码为:84978981 联系电话为:13611111111'
>>> result = re.sub(pattern,'1xxxxxxxxxx',string)
>>> print(result)
中奖号码为:84978981 联系电话为:1xxxxxxxxxx

使用正则表达式分割字符串

split()方法用于实现根据正则表达式分割字符串,并以列表的形式返回。split()方法的语法格式如下:

re.split(pattern,string,[maxsplit],[flags])

pattern:表示模式字符串,由要匹配的正则表达式转换而来。
string:表示要匹配的字符串。
maxsplit:可选参数,表示最大的拆分次数。
flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

>>> import re
>>> pattern = r'[?|&]'
>>> ur1 = 'http://www.baidu.com/login.jsp?username="mr"&pwd="mrsoft"'
>>> result = re.split(pattern,ur1)
>>> print(result)
['http://www.baidu.com/login.jsp', 'username="mr"', 'pwd="mrsoft"']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值