正则表达式之元字符与转义

re.search("^[0-9]$","2")!=None

如上的Python正则表达式例子中,字符组中的横线-并不表示匹配横线字符,而是用来表示范围的,这类字符叫做元字符噶粉色发噶三个人。字符组中的开方括号[、闭方括号]和之前的^、$都是元字符。在匹配中,它们有着特殊的意义。

但是有的时候我们的确需要匹配如上的元字符,此时就需要特殊处理(如转义)。

处理如下:

       如果要在字符组内部使用横线-,最好的办法是将它放在字符组的最开头即[的后面。如[-09]就是包含三个字符-、0、9的字符组;[-0-9]则是由"范围表示法"0-9和横线-共同组成的字符组,包含11个字符。

       对于其他元字符也包含横线-,取消特殊含义的方法是转义,也就是在正则表达式中的元字符之前加上反斜线字符\。

如:

  re.search("^[-09]$","-") !=None #=>True

使用转义的方法:

  re.search("^[0\\-9]$","-")!=None  #=>True

注:这里写的是[0\\-9],而不是[0\-9].因为在Python中正则表达式是以字符串的形式提供的,而字符串本身是有关与转义的规定的,上面的正则表达式因为要引入\,所以在字符串形式的正则表达式中(当然明确的说还不是正则表达式)要再写一个\,这样就实现了[0\-9]这样的正则。就是说正则表达式中的每个反斜线字符\,在字符串中还必须转义为\\。所以正则表达式[0\-9],在程序中写的却是[0\\-9]。

     不过,Python中提供了原生字符串,它非常适合于正则表达式:正则表达式是什么样,原生字符串就是什么样。不必考虑正则表达式之外的转义。原生字符串的形式是r "string"即普通字符串之前添加r。所以

re.search("^[0\\-9]$","-")可以使用re.search(r"^[0\-9]$","-")代替。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值