记一次regexp_extract和regexp_replace的使用bug

项目场景:

有一次需求需要使用到正则 去匹配一个连接字符,需要把他们分开,进行处理,发现了regexp_extract的一些使用 bug


问题描述

首先我们可以先看一下 regexp_extract的 使用用法

regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp
字符串正则表达式解析函数。

参数解释:
其中:
str是被解析的字符串
regexp 是正则表达式
idx是返回结果 取表达式的哪一部分 默认值为1。
0表示把整个正则表达式对应的结果全部返回
1表示返回正则表达式中第一个() 对应的结果 以此类推
注意点:
要注意的是idx的数字不能大于表达式中()的个数。 否则报错。


下面是我的测试用例
首先,我们先看一下在正则在线工具上 我们的正则表达式匹配到的结果,这些正是我想要的 正确结果
在这里插入图片描述
按理说 我们把它复制到 hive的函数里面 就可以了,下面是我sql语句 但是结果却不是正确的,它只给我返回了第一个-99,其他的均不返回了 费解???

WITH r AS (
    SELECT regexp_extract('1-99,2-102,3-103,4-104,8-101','(-\\d+)',0)
 )
 SELECT * FROM r;

在这里插入图片描述


原因分析:

暂不知道什么原因 求看到此文的大佬给个解释


解决方案:

提示:解决方案 我使用了regexp_replace 进行解决

WITH r AS (
    SELECT regexp_replace('1-99,2-102,3-103,4-104,8-101','(\\d+-)','')
 )
 SELECT * FROM r;

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值