python里使用正则表达式的非贪婪模式

原创 2017年10月07日 18:01:58
在正则表达式里,什么是正则表达式的贪婪与非贪婪匹配


  如:String str="abcaxc";


    Patter p="ab*c";


  贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab*c)。


  非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab*c)。


解决这个问题,可以采用:
 正则引擎默认是贪婪的,当出现"*"时,它会尽量去匹配尽可能长的字符串。
 一个用于修正以上问题的可能方案是用"*"的惰性代替贪婪性。你可以在"*"后面紧跟一个问号"?"来达到这一点  
这告诉正则引擎,尽可能少的重复上一个字符。

如下面的例子:

#python 3. 6
#蔡军生 
#http://blog.csdn.net/caimouse/article/details/51749579
#
from re_test_patterns import test_patterns

test_patterns(
    'abbaabbba',
    [('ab*?', 'a followed by zero or more b'),
     ('ab+?', 'a followed by one or more b'),
     ('ab??', 'a followed by zero or one b'),
     ('ab{3}?', 'a followed by three b'),
     ('ab{2,3}?', 'a followed by two to three b')],
)

输出结果如下:

'ab*?' (a followed by zero or more b)


  'abbaabbba'
  'a'
  ...'a'
  ....'a'
  ........'a'


'ab+?' (a followed by one or more b)


  'abbaabbba'
  'ab'
  ....'ab'


'ab??' (a followed by zero or one b)


  'abbaabbba'
  'a'
  ...'a'
  ....'a'
  ........'a'


'ab{3}?' (a followed by three b)


  'abbaabbba'
  ....'abbb'


'ab{2,3}?' (a followed by two to three b)


  'abbaabbba'
  'abb'
  ....'abb'

深入浅出Numpy
http://edu.csdn.net/course/detail/6149 

Python游戏开发入门

http://edu.csdn.net/course/detail/5690

你也能动手修改C编译器

http://edu.csdn.net/course/detail/5582

纸牌游戏开发

http://edu.csdn.net/course/detail/5538 

五子棋游戏开发

http://edu.csdn.net/course/detail/5487
RPG游戏从入门到精通
http://edu.csdn.net/course/detail/5246
WiX安装工具的使用
http://edu.csdn.net/course/detail/5207
俄罗斯方块游戏开发
http://edu.csdn.net/course/detail/5110
boost库入门基础
http://edu.csdn.net/course/detail/5029
Arduino入门基础
http://edu.csdn.net/course/detail/4931
Unity5.x游戏基础入门
http://edu.csdn.net/course/detail/4810
TensorFlow API攻略
http://edu.csdn.net/course/detail/4495
TensorFlow入门基本教程
http://edu.csdn.net/course/detail/4369
C++标准模板库从入门到精通 
http://edu.csdn.net/course/detail/3324
跟老菜鸟学C++
http://edu.csdn.net/course/detail/2901
跟老菜鸟学python
http://edu.csdn.net/course/detail/2592
在VC2015里学会使用tinyxml库
http://edu.csdn.net/course/detail/2590
在Windows下SVN的版本管理与实战 
http://edu.csdn.net/course/detail/2579
Visual Studio 2015开发C++程序的基本使用 
http://edu.csdn.net/course/detail/2570
在VC2015里使用protobuf协议
http://edu.csdn.net/course/detail/2582
在VC2015里学会使用MySQL数据库
http://edu.csdn.net/course/detail/2672


版权声明:本文为博主原创文章,未经博主允许不得转载。

python 正则表达式贪婪模式与非贪婪模式

之前未接触过正则表达式,今日看python网络爬虫的源码,里面一行正则表达式匹配的代码初看之下,不是很理解,代码如下:myItems = re.findall('(.*?)',unicodePage,...
  • haoxizh
  • haoxizh
  • 2015年03月26日 12:00
  • 7881

Python 正则表达式里面 贪婪模式和非贪婪模式的区别

贪婪模式 :匹配到了,继续往下走,看看剩下的还没有可以匹配的, 非贪婪模式: 匹配到了,就不继续往下走了. 比如    贪婪模式 源字符串    aa11bb22cc 正则表达式    .* 输出...
  • qq_33447462
  • qq_33447462
  • 2016年05月24日 00:16
  • 2677

[Python]解决正则表达式的"贪婪"匹配

我们看下面的匹配:
  • flyapy
  • flyapy
  • 2014年07月22日 23:04
  • 448

Python正则表达式指南

from http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html by AstralWind难得一见的好文,对了解正则化很有帮助。正...
  • lv26230418
  • lv26230418
  • 2015年04月21日 19:46
  • 2745

python 正则表达式贪婪模式与非贪婪模式

之前未接触过正则表达式,今日看python网络爬虫的源码,里面一行正则表达式匹配的代码初看之下,不是很理解,代码如下:myItems = re.findall('(.*?)',unicodePage,...
  • haoxizh
  • haoxizh
  • 2015年03月26日 12:00
  • 7881

正则表达式贪婪模式与非贪婪模式

1.定义:什么是贪婪模式与非贪婪模式 string str="abcaxc"; string regex="ab\w*c"; 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为。 ...
  • cherish1forever
  • cherish1forever
  • 2015年10月13日 14:55
  • 1785

Python——正则表达式(5)

本文介绍了使用Python正则表达式的常见问题,match与search的使用,贪婪与非贪婪的选择以及使用re.VERBOSE标志等...
  • ggGavin
  • ggGavin
  • 2016年03月01日 15:48
  • 1695

(学习)python非贪婪、多行匹配正则表达式例子

一些regular的tips: 1 非贪婪flag >>> re.findall(r"a(\d+?)", "a23b") # 非贪婪模式         ['2'] >>> re.findall(r...
  • my2010Sam
  • my2010Sam
  • 2013年08月19日 11:21
  • 17445

正则表达式之 贪婪与非贪婪模式详解(概述)

1 概述 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NF...
  • u014762221
  • u014762221
  • 2017年04月02日 17:36
  • 275

正则表达式知识详解之贪婪模式和非贪婪模式 (java版示例)

正则表达式知识详解系列,通过代码示例来说明正则表达式知识,建议自己按照例子手打一遍。 本示例的源代码下载地址:http://download.csdn.net/detail/gnail_oug/95...
  • gnail_oug
  • gnail_oug
  • 2016年04月27日 12:59
  • 1754
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:python里使用正则表达式的非贪婪模式
举报原因:
原因补充:

(最多只允许输入30个字)