Hive正则表匹配字符:regexp_extract()

本文介绍了Hive中的regexp_extract函数,用于根据正则表达式拆分字符串,并详细讲解了正则匹配表达式,包括元字符、位置匹配和频率匹配。同时提到了regexp_substr函数及其参数说明,以及regexp判断语句的使用。
摘要由CSDN通过智能技术生成

regexp_extract函数用法

语法

regexp_extract(string subject, string pattern, int index)

返回值: string

功能:将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符。

第一参数:   要处理的字段

第二参数:    需要匹配的正则表达式

第三个参数:

  • 0是显示与之匹配的整个字符串
  • 1 是显示第一个括号里面的
  • 2 是显示第二个括号里面的字段

附:正则匹配表达

1、元字符匹配

.  表示匹配除换行符以外的任意字符。
[xyz]    字符集(character set),匹配这个集合中的任一一个字符(或元字符)
[^xyz]    不匹配这个集合中的任何一个字符
[/b]    匹配一个退格符
/b    匹配一个单词的边界
/B    匹配一个单词的非边界
/cX    这儿,X是一个控制符,//cM/匹配Ctrl-M
/d    匹配一个字数字符,//d/ = /[0-9]/
/D    匹配一个非字数字符,//D/ = /[^0-9]/
/n    匹配一个换行符
/r    匹配一个回车符
/s    匹配一个空白字符,包括/n,/r,/f,/t,/v等
/S    匹配一个非空白字符,等于/[^/n/f/r/t/v]/
/t    匹配一个制表符
/v    匹配一个重直制表符
/w    匹配字母、下划线、数字或汉字,等于[a-zA-Z0-9]
/W    匹配一个不可

  • 3
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值