php 正则贪婪模式_正则表达式的贪婪模式和非贪婪模式

本文介绍了正则表达式中贪婪和非贪婪模式的区别,并通过一个具体的例子——从Postgres逻辑复制输出中提取字段名、类型和值——展示了这两种模式的应用。在Golang中,使用非贪婪模式避免了匹配错误的问题,通过添加(?U)标志实现了期望的匹配结果。
摘要由CSDN通过智能技术生成

一直听说过正则表达式存在贪婪和非贪婪模式,大概就是最少匹配和最多匹配的区别,看到的例子大多是下面这个例子

源字符串: aabab

贪婪模式串: a.b

非贪婪模式串: a.?b

贪婪模式结果: aabab

非贪婪模式结果: aab

上面这个例子虽然简单,但是感觉代表性不强,实现今天在解析postgres 逻辑复制的输入时, 刚好碰到一个例子,特来记录下:

输出如下:

table public.t_02: UPDATE: id[integer]:1 name[text]:'name[text]:' create_date[date]:'2020-11-01' bbb[bytea]:null

在通过split之后, 得到待处理的字符串,。

源字符串:name[text]:'name[text]:'

其中name是字段名,text是字符类型, 'name[text]:'是字段的值,现在要通过正则表达式来提取字段名,类型以及字段值。

[]中包含的是类型, :后面的是字段值,因此很自然的想到这个模式串:

^(.*)\[(.*)\]:(.*)$

代码如下:

parttern = `^(.*)\[(.*)\]:(.*)$`

reg = regexp.MustCompile(parttern)

result = reg.FindStringSubmatch(v)

col := Column{

Name: result[1],

Type: result[2],

Value: result[3],

}

匹配结果分为三组,

1. name[text]:'name

2. text

3. '

完全不是我想要的结果 -_-!!!

出现问题的原因是值里面也出现name[type]:value的模式,所以刚好踩到了贪婪模式的坑。

这里其实golang给了一个迷惑性的说法, regexp.MustCompile是最左、最短匹配, 而regexp.MustCompilePOSIX是最左、最长匹配, 因此,我还以为MustCompile已经是非贪婪匹配了。不过好在golang提供了匹配标志(?U)来表示非贪婪匹配,修改之后的代码如下:

parttern = `^(?U)(.*)\[(.*)\]:(.*)$` // (?U)非贪婪模式

reg = regexp.MustCompile(parttern)

result = reg.FindStringSubmatch(v)

col := Column{

Name: result[1],

Type: result[2],

Value: result[3],

}

匹配结果:

1. name

2. text

3. 'name[text]:'

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值