java正则反向引用,hive正则表达式反向引用

反向引用

捕获会返回一个捕获组,这个分组是保存在内存中的,不仅可以在正则表达式外部通过程序进行引用,也可以在正则表达式内部进行引用,这种引用方式就是反向引用。

根据捕获组的命名规则,反向引用可分为:

1.数字编号组反向引用:\k或\number

2.命名编号组反向引用:\k或\‘name’

捕获组是匹配子表达式的内容按序号或者命名保存起来以便使用,主要是用来查找一些重复的内容或者替换指定字符。

Java捕获组

捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。

例如,正则表达式 (dog) 创建了单一分组,组里包含"d",“o”,和"g"。

捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:

((A)(B©))

(A)

(B©)

©

可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。

还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。

1 select

'ccabab' rlike "(\\w)(\\w)\\1\\2"

2 select

'abac' regexp '(\\w)(\\w)\\1\\2'

3 select

regexp_replace('ababcccdcd','(\\w)(\\w)\\1\\2','')

4 select

regexp_extract('ababcccdcd','(\\w)(\\w)\\1\\2',0)

注意:

1.反向引用数字用\\1

2.regexp_replace是全部替换

3.regexp_extract函数index=0,如果不则index默认为1,同时提取是第一配对的字段串

regexp_extract函数源码

010dd5ba5835821a9cc0086bcf028046.png

0e694ae088447adf6b77e8a21afe2817.gif

4a668feaa3018a2e1706f07e5002bcc8.png

weixin_42412645

发布了40 篇原创文章 · 获赞 1 · 访问量 1万+

私信

关注

标签:正则表达式,捕获,hive,反向,引用,regexp,select

来源: https://blog.csdn.net/weixin_42412645/article/details/104067984

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值