正则表达式: 提取指定范围[n~m]字符内容

最新推荐文章于 2023-07-21 15:14:39 发布

LongGe_Arsenal

最新推荐文章于 2023-07-21 15:14:39 发布

阅读量5.8k

点赞数 3

分类专栏：正则表达式 Java 文章标签：正则表达式前端后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LongGe_Arsenal/article/details/121258881

版权

正则表达式同时被 2 个专栏收录

1 篇文章

订阅专栏

1 篇文章

订阅专栏

本文详细解析了正则表达式中的后行断言(?<=^.{n}

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

正则表达式:

(?<=^.{n}).{n,m-n}

表达式解析：

n：提取字符串的起始坐标

m：提取字符串的结束坐标

如要从 abc12345ssdlh 字符串中，提取从第3位开始到第8位的字符串12345。

正则表达式为(?<=^.{3}).{3,5}

整个正则拆为三部分

^.{n}

这部分表示匹配任意开头的n个字符

(?<=^.{n})

这部分的语法使用正则表达式的后行断言
。

正则表达式的先行断言和后行断言一共有 4 种形式：

(?=pattern) 零宽正向先行断言(zero-width positive lookahead assertion)
(?!pattern) 零宽负向先行断言(zero-width negative lookahead assertion)
(?<=pattern) 零宽正向后行断言(zero-width positive lookbehind assertion)
(?<!pattern) 零宽负向后行断言(zero-width negative lookbehind assertion)

这里面的 pattern 是一个正则表达式。

如同 ^ 代表开头，$ 代表结尾，\b 代表单词边界一样，先行断言和后行断言也有类似的作用，它们只匹配某些位置，在匹配过程中，不占用字符，所以被称为"零宽"。所谓位置，是指字符串中(每行)第一个字符的左边、最后一个字符的右边以及相邻字符的中间（假设文字方向是头左尾右）。

(?<=pattern) 代表字符串中的一个位置，如下图中带颜色的小竖线，紧接该位置之前的字符序列能够匹配 pattern。

例如对 regex represents regular expression 这个字符串，有 4 个单词，要想匹配单词内部的 re，但不匹配单词开头的 re，可以用 (?<=\w)re，单词内部的 re，在 re 前面应该是一个单词字符。

之所以叫后行断言，是因为正则表达式引擎在匹配字符串和表达式时，是从前向后逐个扫描字符串中的字符，并判断是否与表达式符合，当在表达式中遇到该断言时，正则表达式引擎需要往字符串前端检测已扫描过的字符，相对于扫描方向是向后的。

.{n,m-n}

这部分就是匹配任意字符最少匹配 n 次且最多匹配 m 次。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。