在cdsc中的java版,有人提出这样的一个问题,即
见原文:http://topic.csdn.net/u/20110913/21/b294d5c6-7a91-4a82-a139-a934398b32f3.html?54825
这是为什么呢,.{3,10}表示,匹配任意的字符,至少匹配3次,但最多不超过10次,然后后面接一个 + ,最后表示有一个数字结尾。粗看起来,aaaa5bbbb6能够匹配,它可以表示为.{9}[0-9],但在这个表达式中,不能被匹配,原因就在于这个表达式是一个贪婪匹配,它不会交还已经匹配的字符。
在本文中,.{3,10}+匹配了整个字符串,但由于大括号{}后面的+的存在,导致它不会为了后面的[0-9]匹配而交还已经匹配的字符6,所以导致在匹配[0-9]时,已经找不到字符用于匹配,所以最终不能匹配字符串。
如果要想匹配字符串,将+删除或者修改为其它的谓语表达式如?即可以匹配,但需要注意的是,如果修改为?,则最终仅匹配 aaaa5,而不是整个字符串。因为?表示尽量少的匹配。
java中的这个贪婪匹配在正则表达式中还有一个相同作用的写法与之相对应,即固化分组,其语法为 (?>)。在本文中的这个表达式可以写为 (?>.{3,10})[0-9] ,与本文中的表达式在效果上是一样的。
本文中的相关解释参考了《精通正则表达式》。
相关文章:
作者: flym
I am flym,the master of the site:)查看flym的所有文章