HiveSQL SparkSQL 正则表达式

最新推荐文章于 2024-07-09 22:21:42 发布

000X000

最新推荐文章于 2024-07-09 22:21:42 发布

阅读量3.7k

点赞数 1

文章标签： HIVE SPARK SQL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ytp552200ytp/article/details/86637153

版权

这里对sql常用的一些正则匹配作一些匹配，都是来源别人博客，此处稍作整理和总结。mark一下

1、sql中有like 和 rlike，具体区别

like：

%：匹配零个及多个任意字符

_：与任意单字符匹配

[]：匹配一个范围

[^]：排除一个范围

ESCAPE 关键字定义转义符 WHERE ColumnA LIKE '%5/%%' ESCAPE '/'

like不是正则，而是通配符

rlike:

rlike是正则，正则的写法与java一样。'\'需要使用'\\',例如'\w'需要使用'\\w'

A rlike '\\d+' 匹配一个或多个数字， not A rlike '\\d+' 匹配非数字

直接在条件里面写正则表达式

2、hive sql 中正则匹配函数

regexp 功能和 rlike类似

select count(*) from olap_b_dw_hotelorder_f where create_date_wid regexp '\\d{8}'
select count(*) from olap_b_dw_hotelorder_f where create_date_wid rlike '\\d{8}'

regexp_extract(string subject, string pattern, int index) 将字符串subject按照pattern正则表达式的规则拆分，返回index指定的字符

select regexp_extract('IloveYou','(I)(.*?)(You)',1) from test1 limit 1 // 1 匹配 I，2匹配 love，3匹配 You

regexp_replace(string A, string B, string C) 将字符串A中的符合Java正则表达式B的部分替换为C

select regexp_replace("IloveYou","You","") from test1 // Ilove

这里几个函数类似oracle的5个正则函数，具体可参考oracle的正则匹配函数
---------------------------------------------------------------------------------------------------------------------------------------------

1.regexp
语法: A REGEXP B
操作类型: strings
描述: 功能与RLIKE相同

select count(*) from olap_b_dw_hotelorder_f where create_date_wid not regexp '\\d{8}'
1
与下面查询的效果是等效的：

select count(*) from olap_b_dw_hotelorder_f where create_date_wid not rlike '\\d{8}';
1
匹配中文：

self.reg = ‘regexp "[\u4e00-\u9fa5]"’

关于Hive正则匹配中文字符串的问题

首先，中文字符集为 '^[\\4e00-\\u9fa5]$'

1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\\u4e00-\\u9fa5]$’ 进行匹配

2.如果在终端调用，则需叫上转义符，如

hive -e "select '中国'  rlike ‘^[\\\u4e00-\\\u9fa5]$’"
name rlike '^[\\u4e00-\\u9fa5]+$'

关注

1
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

000X000 CSDN认证博客专家 CSDN认证企业博客

码龄7年

523: 原创

6108: 周排名

3294: 总排名

81万+: 访问

: 等级

8563: 积分

1447: 粉丝

1200: 获赞

162: 评论

4932: 收藏

私信

关注

热门文章

分类专栏

最新评论

Docker pull镜像一直在Waiting无法下载，根本解决方法
White–Night: 如果你的梯子没问题，那应该是你没有将docker的仓库改到国外的，docker配置没改还是使用国内的仓库源，这样的话肯定waiting，这个我试过了，国内全军覆没，梯子ok的话国外源仓库正常拉取
Docker pull镜像一直在Waiting无法下载，根本解决方法
妙趣生花: 关键是我梯子一直挂着也提示Waiting 就贼无语
Flink 状态管理详解（超全收藏）
Randy_Sky: 你说了是算子，那么就算子状态而言，一个算子的并行度为3，那么相当于有有三个subtask中有这个算子的实例，而每个subtask只能访问到这个subtask本地的算子状态数据，所以各个线程之间的算子状态数据并不共享，每个subtask在处理数据时，访问和更新状态值的范围被限制在当前subtask中
Spark 解析嵌套的 JSON 文件
ha_lydms: 博主的文章一直都是我的学习指南，内容详实，让我从中获益良多，每篇博文都写的很好，你的博客内容深入浅出，期待你的下一次精彩分享
Flink 状态管理详解（超全收藏）
a160010: 如果一个算子的并行度是3 ，各个并行度之间的状态是共享的吗？

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。