hive中简单的正则表达式

最新推荐文章于 2024-08-05 09:24:28 发布

abothli

最新推荐文章于 2024-08-05 09:24:28 发布

阅读量1.7k

点赞数

分类专栏： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaolong_4_2/article/details/81024053

版权

hive 专栏收录该内容

30 篇文章 1 订阅

订阅专栏

Hive中可以使用自带的函数regexp_extract(string,regex,index)来判断

比如下面的语句

select regexp_extract('www.baidu.com','[\\w\\.]+',0) from test1  limit 10;

特别注意的是hive中要使用双斜线

在真实的语句中，只需替换第一个即可

select regexp_extract(name,'[\\w\\.]+',0) from student where class='1' limit 10;

最后一个参数的意思是第几个元组中正则表达式返回的值，默认是0，返回所有表达式在一起的值

当index为1时，表示正则表达式中第一个元祖的值

select regexp_extract('www.baidu.com','(\\w+)(\\.)',1) from test1 limit 10;

返回结果

www

当index为2时,返回的是第几个元祖中的正则表达式

select regexp_extract('www.baidu.com','(\\w+)(\\.)',2) from test1  limit 10;

返回结果

-----------------------------------------------------------------------------------------------------------------------------------------

Hive中除了上面的regexp_extract函数，还包括like、rlike这样的用法

like中：_表示单个字符，%号代表任意字符

hive> select A like _bai% from default.dual; ----表示A字段中，第一个字符任意，接下来三个字母必须是bai，后面的字母任意
wbai
abai123
3baijlk

rlike表示like启用正则表达式

hive> select 1 from dual where A rlike '^f.*r$'; -----表示以f开头，中间任意字符，r结尾的字符
footbar
fsssdffsr

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。