Python字符串匹配的简单应用

在《Python 基础教程》中,作者在讲解re之前和我们来了个美式幽默:有些人面临一个问题时会想:"我知道,可以使用正则表达式来解决这个问题。”于是现在他们就有两个问题了。简单的一句玩笑话,却道出正则表达式是一个不容易的问题。这里,我浅析一下正则表达式的一个简单应用,希望能够起到抛砖引玉的作用。

在正则表达式中,一个比较常用的方法就是re.search(pattern, string, flags = 0).参数pattern是以字符串形式提供的正则表达式,string是需要匹配的字符串,如果匹配成功,则返回一个MatchObject,否则返回None。方法MatchObject.group(0)会返回匹配到的字符串。

Remark:

第一,因为暂时还不需要关心匹配结果的细节,只关心有没有结果,所以在re.search()之后添加判断返回值是否为None,如果为True,则表示匹配成功,否则返回False表示匹配失败。为节省版面,尽可能用注释表示这类匹配结果,如# => True或者 # => False,附在语句之后。

第二,目前我们关心的是整个字符串是否能由正则表达式匹配。但是,在默认情况下re.search(pattern, string)只判断string的某个子串能否由pattern匹配,即便pattern只能匹配string的一部分,也不会返回None。为了测试整个string能否由pattern匹配,在pattern两端加上^和$。^和$是正则表达式中的特殊字符,它们并不匹配任何字符,只是表示"定位到字符串的起始位置"和"定位到字符串的结束位置"(原理如图所示),这样就保证;只有在整个string都可以由pattern匹配时,才算匹配成功,不返回None,如所示。

例 使用^和$测试string由pattern完整匹配

# 只要字符串中包含数字字符,就可以匹配  
re.search("[0123456789]", "2") != None          #  => True  
re.search("^[0123456789]$", "12") != None       #  => False   
re.search("[0123456789]", "a2") != None             #  => True  
 
# 整个字符串就是一个数字字符,才可以匹配  
re.search("[0123456789]", "2") != None          #  => True  
re.search("^[0123456789]$", "12") != None       #  => False  
re.search("^[0123456789]$", "a2") != None       #  => False 

参考:http://book.51cto.com/art/201204/332389.htm


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值