java正则表达式？=等特殊部分

最新推荐文章于 2023-03-26 23:05:58 发布

二哥的博客

最新推荐文章于 2023-03-26 23:05:58 发布

阅读量1.5k

点赞数 1

分类专栏： java 文章标签：正则表达式捕获组非捕获组 java

本文链接：https://blog.csdn.net/abcd_d_/article/details/17206499

版权

java 专栏收录该内容

29 篇文章 0 订阅

订阅专栏

最近学习正则表达式，发现其中有一部分特殊结构，如？= 、？！、？<=等，这些在网上几乎找不到参考资料（也许鄙人搜索技术不过关），于是通过对API的阅读以及测试，大致了解了这部分内容。

本文只讲正则表达式里面比较少见的部分如？=等，常见的网上资料已经很多了！在此就不啰嗦了。

从API文档里面，我们可以看到有一部分正则表达式结构比较特殊，如下图：

首先，区别一下捕获内容和捕获组的区别：

比如下列字符串：

Lorem ipsum dolor sit amet consectetuer feugiat fames malesuada pretium egestas.

如果使用以下正则表达式匹配：

\b(\S)(\S)(\S)(\S*)\b

我们会得到如下结果:

Match "Lorem"
     Group 1: "L"
     Group 2: "o"
     Group 3: "r"
     Group 4: "em"
Match "ipsum"
     Group 1: "i"
     Group 2: "p"
     Group 3: "s"
     Group 4: "um"
...

Match "consectetuer"
     Group 1: "c"
     Group 2: "o"
     Group 3: "n"
     Group 4: "sectetuer"
...

从上例我们可以知道一个（）扩起来的称为一个捕获组，一个正则表达式（捕获内容）可以含有多个捕获组。

然后说明一下捕获组和非捕获组的区别：捕获组即是可以用group（）函数获取内容的，非捕获组则不在group（）内容之内。（注意无论是捕获组还是非捕获组，他们都能被正则表达式捕获到，只是非捕获组没有出现在group（）里面）。

接下来，让我逐行解释：

(?<name>X)： 匹配出X，表示一个命名了的捕获组，即不可以用group（int i）函数获取，而要用group(String name)函数获取。

(?：X)： 匹配出X，为捕获组。

(?idmsuxU-idmsuxU)： 匹配出""，匹配出所有的""(属于零长度匹配，可以百度)。

(?idmsuxU-idmsuxU：X)： 匹配出X

(?=X)：匹配出以X前面的内容（类似结束边界），如字符串ambassador，表达式 a（？=d）匹配出最后一个a。

(?！X)：匹配出以X后面的内容（类似开始）（仅通过部分测试，不太肯定）

(?<=X)：匹配出以X后面的内容（类似开始边界）

(?<！X)：匹配出以X前面的内容（类似结束边界）（仅通过部分测试，不太肯定）

(?>X)：匹配出以X，属于非捕获组。 (目前也不清楚independent是什么意思)

以上是鄙人愚见，有不妥之处，还望指正！另外，对于（？！X)和（？<=X)的区别（还有(？<！X)和（？=X) ），还有最后一个（？>X）的原文档的independent之意，在下暂不清楚，也希望和各位交流一下。

二哥的博客

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
java正则表达式？=等特殊部分

最近学习正则表达式，发现其中有一部分特殊结构，如？= 、？！、？本文只讲正则表达式里面比较少见的部分如？=等，常见的网上资料已经很多了！在此就不啰嗦了。从API文档里面，我们可以看到有一部分正则表达式结构比较特殊，如下图：首先，区别一下捕获内容和捕获组的区别：比如下列字符串：Lorem ipsum dolor sit amet conse
复制链接

扫一扫