Hive中常用正则表达式的运用

本文介绍了在Hive中使用正则表达式进行数据提取的方法,包括like、rlike、regexp、regexp_replace和regexp_extract函数的用法,并给出了多个实例。还探讨了正则表达式的基础语法和常用元字符的使用,例如身份证号、日期格式和邮箱验证等。
摘要由CSDN通过智能技术生成

在实际的应用中,通常需要在一些复杂的、没有规律的字符串中提取数据,这时候就需要用到正则表达式了,这次讲一下hive的正则表达式。

like

语法: A like B

说明:如果字符串A符合表达式B的正则语法,则为true,否则为flase。B中字符"_"表示任意单个字符,而字符"%"表示任意数量的字符。

例子:select 'AA123' like 'AA%';

结果:true

例子:select 'AAbbbbcccc' like '_A%';

结果:true

rlike

语法: A rlike B

说明:如果字符串A符合JAVA正则表达式B的正则语法,则为TRUE,否则为FALSE。

例子:select 'AAbbbbcccc' rlike 'AA';

结果:true

regexp

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值