java正则表达式不包含_java使用正则表达式匹配不包含某个规则的字符串

weixin_39957951

于 2021-02-12 16:15:57 发布

阅读量511

点赞数

文章标签： java正则表达式不包含

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39957951/article/details/114058070

版权

测试数据：

例如上面这几条简单的日志条目，我们想实现两个目标：

1、把8号的数据过滤掉；

2、把那些不包含robots.txt字符串的条目给找出来(只要Url中包含robots.txt的都给过滤掉)。

前瞻的语法是：(?!匹配模式)

我们先来实现第一个目标——匹配不以特定字符串开头的条目。

这里我们因为要排除一段连续的字符串，因此匹配模式非常简单，就是2009-07-08。实现如下：^(?!2009-07-08).*?$

用Expresso我们可以看到结果确实过滤掉8号的数据。

接下来，我们来实现第二个目标——排除包含特定字符串的条目。

按照我们上面写法，我照葫芦画瓢了一下：^.*?(?!robots\.txt).*?$

这段正则用大白话描述就是：开头任意字符，然后后面不要跟着robots.txt连续字符串，然后再跟着任意个字符，字符串结尾。

运行测试，结果发现：

没有达到我们想要的效果。这是为什么呢？我们给上面的正则表达式加上两个捕获分组调试一下：^(.*?)(?!robots\.txt)(.*?)$

测试结果：

我们看到，第一个分组啥都没有匹配到，而第二个分组却匹配了整个字符串。再回过头来好好分析一下刚才那个正则表达式。

实际上，当正则引擎解析到A区域的时候，就已经开始执行B区域的前瞻工作。这个时候发现当A区域为Null的时候匹配成功——.*本来就允许匹配空字符，前瞻条件又满足，A区域后面紧跟着的是“2009”字符串，而并不是robots。因此整个匹配过程成功匹配到所有条目。

分析出原因之后我们对上述的正则进行修正，将.*?移入前瞻表达式，如下：^(?!.*?robots).*$

测试结果：

weixin_39957951

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java正则表达式不包含_java使用正则表达式匹配不包含某个规则的字符串

测试数据：例如上面这几条简单的日志条目，我们想实现两个目标：1、把8号的数据过滤掉；2、把那些不包含robots.txt字符串的条目给找出来(只要Url中包含robots.txt的都给过滤掉)。前瞻的语法是：(?!匹配模式)我们先来实现第一个目标——匹配不以特定字符串开头的条目。这里我们因为要排除一段连续的字符串，因此匹配模式非常简单，就是2009-07-08。实现如下：^(?!2009-07-0...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。