正则表达式之正负向预查使

引用: http://blog.csdn.net/oyiboy/archive/2005/12/04/543605.aspx
闲话:写Blog。对我这种懒人来说,简直就是...没事找事作,有空不如去睡觉,不过,脱离公司后一直忙于写程序终于发现了Blog的作用,另一 个记录东西的硬盘,哈哈,要找以前的资料直接到自己的Blog里找就行了,不错呢,今天决定了。以后不定时的更新Blog,作为记录用。

  正文:今天记录正则表达式的正负向预查使。
   一个问题一时困扰着我,从以前练手写ASP的语法分析器,到后来帮朋友的采集器(小偷来着)就是:“.*?script.*?”是匹配一行中有 script的字符串,而想匹配一行中没有script的字符串又怎么作呢?“.*?[^script].*?”?明显不行。[^]是不包含里面的每个字 符。也就是只要行里不包含有s、c、r、i、p、t都能匹配。这个自然不是我想要的。
  突然想到,这两天群天太安静了,静得有点无聊,上去问问那些潜水高手们。很快得到指点,用“?!”,当时我楞了一下。“?!”是什么..查Vbscript手册,没有这玩意。突然想起我的网文捕快里有一篇微软的正则表达式简介。
  经查。“?!”叫“负向预查”(正是本文的主角之一),以下引用微软公司的正式介绍:

(?!pattern) 负向预查,在任何不匹配Negative lookahead matches the search string at any point where a string not matching pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如'Windows(?!95|98|NT|2000)' 能匹配Windows 3.1" 中的 "Windows"但不能匹配 "Windows 2000" 中的 "Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

  而这位“负向预查”使还有一位兄弟“正向预查”使,"(?=)",以下是微软公司对其的正式介绍信:

(?=pattern) 正向预查,在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,'Windows (?=95|98|NT|2000)' 能匹配"Windows 2000"中的"Windows",但不能匹配"Windows3 .1"中"Windows"。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开 始。

  从上面的字面上看"?!"和"?="组合中的()起不到普通()的标记子表达式的作用,他们只是为了配合"?!"和"?="指定范围而出现的,如果要将匹配结果标记成子表达式存放到Matches(vbscript的正则集合)内的话需要在外向再加一层()。
  说了这么多,回到刚刚开始的例子。“.*?script.*?”是匹配一行中包含有script的字符串,那么其反意正则表达式就是:“.*?(?!script).*”匹配一行中不包含有script的字符串。
  小小提醒,在测试这个正则时我写了一个正则“/n(?!script)*/n”居然会让我的IIS卡死,CPU100%。必须重启IIS才能恢复。原因不知,但请大家留意了。

  闲话:欢迎各位有手机的朋友到我的“海鱼手机加瓦站(http://wwww.fishjava.com)”来转转,有不少的免费的手机游戏和图片提供给各位,不但可以在线试玩游戏,直接通过WAP下载游戏和图片,还能自己上传一些好玩的游戏或图片上来大家一起来玩。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值