Python正则表达式书写容易碰到的陷阱:\W*和\W*?匹配过程遇到的问题

老猿在分析《Python正则表达式\W+和\W*匹配过程的深入分析》中的问题时,想到一个问题,如果“re.split(’(\W*)’,‘Hello,world’)”的处理如果换成非贪婪模式会怎么样,根据老猿的预测,由于在’Hello,world’中没有连续的非单词字符,因此贪婪模式处理和非贪婪模式结果应该一样,如是测试了一下看看效果:

>>> re.split('(\W*)','Hello,world') #贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']
>>> re.split('(\W*?)','Hello,world') #非贪婪模式
['Hello,world']
>>>

看到这结果老猿完全懵圈了,这完全推翻了《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程。但执行结果肯定是正常的,肯定是老猿自己的问题,大家觉得问题出在哪里呢?

不卖关子了,《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程应该是没有问题的,问题出在输入的问号上,半角的问号被输入成了全角问号,导致匹配不到对应的搜索文本,所以就将原串作为列表的元素整个返回了。其实结果也告诉我们没有分割成功,结果中的元素只有一个,而不是两个,因为它们是一个单引号标记的字符串。只是才开始老猿没仔细看,把字符串中间的逗号看成了元素分割的逗号,才闹了这么个乌龙。上述语句真正的非贪婪模式执行结果如下:

>>> re.split('(\W*?)','Hello,world') #非贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', '', '', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']

看起来与“re.split(’(\W*)’,‘Hello,world’)”贪婪模式的结果相同,其实还是有些不同的,这个不同点正好体现出贪婪模式和非贪婪模式的区别,具体是怎么回事感兴趣的可以分析一下。

这个案例类似的场景老猿遇到过多次,写出来聊博大家一笑。

老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython

请大家多多支持,点赞、评论和加关注!谢谢!

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Java正则表达式是一种强大的字符串匹配工具,它可以用来检查一个字符串是否符合某种模式。在Java中,正则表达式的使用主要依赖于java.util.regex包中的类和方法。 下面是Java正则表达式的一些基本概念和用法: 1. 字符匹配:使用普通字符直接匹配,例如`"abc"`可以匹配字符串中的"abc"。 2. 字符类:使用方括号`[]`来定义一个字符类,例如`"[abc]"`可以匹配字符串中的"a"、"b"或"c"。 3. 范围:在字符类中可以使用连字符`-`来表示一个范围,例如`"[a-z]"`可以匹配任意小写字母。 4. 量词:使用量词来指定匹配次数,例如`"*"`表示零次或多次匹配,`"+"`表示一次或多次匹配,`"?"`表示零次或一次匹配。 5. 转义字符:使用反斜杠`\`来转义特殊字符,例如`\.`可以匹配句点字符"."。 6. 预定义字符类:Java正则表达式提供了一些预定义的字符类,例如`\d`表示任意数字字符,`\w`表示任意字母、数字或下划线字符。 7. 分组和捕获:使用圆括号`()`来创建一个分组,并可以通过捕获组来获取匹配的结果。 Java中使用正则表达式主要依赖于Pattern和Matcher两个类。Pattern类表示一个正则表达式的编译结果,Matcher类用于对字符串进行匹配操作。 以下是一些常用的正则表达式示例: 1. 匹配手机号码:`String regex = "^1[3-9]\\d{9}$";` 2. 匹配邮箱地址:`String regex = "^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\\.[a-zA-Z0-9_-]+)+$";` 3. 匹配身份证号码:`String regex = "^\\d{17}(\\d|X|x)$";`

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LaoYuanPython

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值