js中正则表达式的贪婪模式和非贪婪模式

转载 2016年05月31日 15:57:02

在讲贪婪模式和惰性模式之前,先回顾一下JS正则基础:

写法基础:

①不需要双引号,直接用//包含 => /wehfwue123123/.test();

②反斜杠\表示转义 =>/\.jpg$/

③用法基础:.test(str);

语法:

①锚点类

/^a/=>以"a"开头

/\.jpg$/=>以".jpg"结尾

②字符类

[abc]:a或b或c

[0-9]:一个数字

[a-z]:一个字母

.       :任意字符

③元字符

^:在[]里面用表示非,在[]外面用表示开头

\d:[0-9]

\s:空白符

\w:[A-Za-z0-9_]

\D:[^\d]-非数字

\S:非空白符

④量词

{m,n}:m到n次

元字符表示:

*:{0,}

?:{0,1}

+:{1,}


难点:贪婪模式/惰性模式

贪婪模式——在匹配成功的前提下,尽可能多的去匹配

惰性模式——在匹配成功的前提下,尽可能少的去匹配

解释一:码文并茂

使用正则表达式中的贪婪、惰性的量词可以控制表达式匹配过程,我们知道量词?、*、+的意义,可以指定相关模式出现的次数,默认的情况下我们使用的是贪婪量词,它的匹配过程是从整个字符串开始查看,如果不匹配就去掉最后一个,再看看是否匹配,如此循环一直到匹配或字符串空为止,如:

vars ="abbbaabbbaaabbb1234";

varre1=/.*bbb/g;//*是贪婪量词

re1.test(s);

这个匹配过程将从整个字符串开始:

re1.test("abbbaabbbaaabbb1234");//false  ,则去掉最后一个字符4再继续

re1.test("abbbaabbbaaabbb123");//false  ,则去掉最后一个字符3再继续

re1.test("abbbaabbbaaabbb12");//false  ,则去掉最后一个字符2再继续

re1.test("abbbaabbbaaabbb1");//false  ,则去掉最后一个字符1再继续

re1.test("abbbaabbbaaabbb");//true ,结束

在贪婪量词的后面加多一个?就变成了惰性量词,它的匹配过程相反,是从前面第一个开始,不匹配则加一个,如此循环直到字符串结束,以上面的为例子。

vars ="abbbaabbbaaabbb1234";

varre1=/.*?bbb/g;//*?是惰性量词

注意:?是加在bbb前面的,即紧跟对应的量词后面

re1.test(s);

它的匹配过程如下:

re1.test("a");//false,  再加一个

re1.test("ab");//false,  再加一个

re1.test("abb");//false,  再加一个

re1.test("abbb");//true,  匹配了,保存这个结果,再从下一个开始

re1.test("a");//false,  再加一个

re1.test("aa");//false,  再加一个

re1.test("aab");//false,  再加一个

re1.test("aabb");//false,  再加一个

re1.test("aabbb");//true,  匹配了,保存这个结果,再从下一个开始

......

三.解释二:直戳原理

贪婪与惰性模式区别如下:

一、从语法角度看

贪婪模式用于匹配优先量词修饰的子表达式,匹配优先量词包括:“{m,n}”、“{m,}”、“?”、“*”和“+”。

惰性模式用于匹配忽略优先量词修饰子表达式,匹配忽略优先量词包括:“{m,n}?”、“{m,}?”、“??”、“*?”和“+?”。

二、从应用角度看

两者均影响被量词修饰的子表达式匹配行为,贪婪模式在匹配成功的前提下尽可能多地匹配,而惰性模式则在匹配成功的前提下尽可能少匹配。惰性模式只被部分NFA引擎支持。

三、从匹配原理看

能达到同样匹配结果的情况下,通常贪婪模式效率较高。

惰性模式都可通过修改量词修饰的子表达式转换为贪婪模式。

贪婪模式可以与固化分组结合,提升匹配效率,而惰性模式不行。



文/玮哥今晚打老虎(简书作者)
原文链接:http://www.jianshu.com/p/889f3885a5bd

正则表达式规则以及贪婪匹配与非贪婪匹配

正则表达式规则,以及贪婪匹配与非贪婪匹配
  • chenlycly
  • chenlycly
  • 2017年02月11日 13:25
  • 1973

JS正则表达式+---贪婪和非贪婪模式学习总结

今天学习和理解了一下正则表达式贪婪与非贪婪模式,总结一下,与大家共享。 首先上一段js代码: try{ str="abcdefgabcdefghijkl"; re1=str.match...
  • EthanQ
  • EthanQ
  • 2011年10月13日 10:45
  • 11204

javascript正则表达式之最长匹配(贪婪匹配)和最短匹配(懒惰匹配)

最近在阅读RequireJS 2.1.15源码,源码开始处定义了一系列的变量,有4个正则表达式: var commentRegExp = /(\/\*([\s\S]*?)\*\/|([^:]|^)\...
  • aitangyong
  • aitangyong
  • 2015年03月03日 12:41
  • 3440

JavaScript正则表达式贪婪模式与惰性模式

JavaScript正则表达式贪婪模式与惰性模式元字符/元符号 匹配规则 例子 结果 ? 匹配出现0次或1次 /a?/.test('abcd'); true + 匹配出现1次或多次 /a+/.tes...
  • lihefei_coder
  • lihefei_coder
  • 2016年11月01日 15:18
  • 773

java 正则表达式非贪婪

在匹配优先量词后加上“?”,即变成属于非贪婪模式的量词 areaName = areaName.replaceAll(".*\"city\":\"(.*?)\".*", "$1");...
  • linminqin
  • linminqin
  • 2012年12月22日 09:13
  • 4707

正则表达式之 贪婪与非贪婪模式详解(概述)

1 概述 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配。非贪婪模式只被部分NF...
  • u014762221
  • u014762221
  • 2017年04月02日 17:36
  • 552

正则表达式贪婪模式与非贪婪模式

1.定义:什么是贪婪模式与非贪婪模式 string str="abcaxc"; string regex="ab\w*c"; 贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为。 ...
  • cherish1forever
  • cherish1forever
  • 2015年10月13日 14:55
  • 2041

Python 正则表达式里面 贪婪模式和非贪婪模式的区别

贪婪模式 :匹配到了,继续往下走,看看剩下的还没有可以匹配的, 非贪婪模式: 匹配到了,就不继续往下走了. 比如    贪婪模式 源字符串    aa11bb22cc 正则表达式    .* 输出...
  • qq_33447462
  • qq_33447462
  • 2016年05月24日 00:16
  • 2878

正则表达式的贪婪与非贪婪

var s=120000|天津市,130000|河北省,210000|辽宁省,220000|吉林省,310000|上海市,320000|江苏省,330000|浙江省,; var r = /310000...
  • phker
  • phker
  • 2009年09月18日 10:58
  • 25165

非贪婪匹配

-- Start 我们接着上节的例子,你有一个文件,其中包括两列,第一列是姓名,第二列是身份证号,中间用逗号分隔。不同的是,姓名和身份证号都用双引号引起来。像下面这样: "尚波","12345...
  • shangboerds
  • shangboerds
  • 2012年04月28日 19:41
  • 5226
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:js中正则表达式的贪婪模式和非贪婪模式
举报原因:
原因补充:

(最多只允许输入30个字)