impala查询转义问题

最新推荐文章于 2023-01-10 13:58:42 发布

cclovezbf

最新推荐文章于 2023-01-10 13:58:42 发布

阅读量1.3k

点赞数

分类专栏： impala 文章标签： impala

本文链接：https://blog.csdn.net/cclovezbf/article/details/124150506

版权

impala 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

select REGEXP_REPLACE('佰分贰拾(深圳)品牌管理有限公司', '\\(', '（')

然后

SELECT vendor_full_name,REGEXP_REPLACE(vendor_full_name, '\\(', '（')
FROM odsmdmdata.sms_vendor_party_t

报错，这就日了狗了仔细看报错日志我就两个\\ 怎么就被转义成4个\\了

所以我只用一个\就好

SELECT vendor_full_name,REGEXP_REPLACE(vendor_full_name, '\(', '（')
FROM odsmdmdata.sms_vendor_party_t
where sms_vendor_id ='40539';

接着研究下 REGEXP_REPLACE 函数

Impala String Functions | 5.9.x | Cloudera Documentationhttps://docs.cloudera.com/documentation/enterprise/5-9-x/topics/impala_string_functions.html

[localhost:21000] > select regexp_replace('aaabbbaaa','b+','xyz');
+------------------------------------------+
| regexp_replace('aaabbbaaa', 'b+', 'xyz') |
+------------------------------------------+
| aaaxyzaaa                                |
+------------------------------------------+
Returned 1 row(s) in 0.11s

这里好理解 b+只得是1个b或者多个b 这里匹配到了bbb 所以bbb替换到xyz ，so easy

[localhost:21000] > select regexp_replace('aaabbbaaa','(b+)','<\\1>');
+----------------------------------------------+
| regexp_replace('aaabbbaaa', '(b+)', '<\\1>') |
+----------------------------------------------+
| aaa<bbb>aaa                                  |
+----------------------------------------------+
Returned 1 row(s) in 0.11s

这里(b+) 指的是 bbb这三个整体注意这个括号不能省略， <\\1>中的\\就是上文bbb ，<>就是包围

select
regexp_replace('aaabbbaaa','(b+)','<\\1>'),
regexp_replace('aaabbbaaa','b+','<\\1>'), --验证必须有()
regexp_replace('aaabbbaaa','(b+)','【\\1】'),--验证<>可以随意替换
regexp_replace('aaabbbaaa','a(b+)','【\\1】')--验证只有括号里的才有用

[localhost:21000] > select regexp_replace('123-456-789','[^[:digit:]]','');
+---------------------------------------------------+
| regexp_replace('123-456-789', '[^[:digit:]]', '') |
+---------------------------------------------------+
| 123456789                                         |
+---------------------------------------------------+

[[:digit:]]代表数字，这种写法是为了避免转义字符， ^是非的意思

验证

select regexp_replace('123-456-789','[^\\d+]',''),
regexp_replace('123-456-789','[[:digit:]]','')

以上3个demo都很简单，但是我网上查到一个突然就有点懵了

SELECT REGEXP_REPLACE('(jackie)&|(jackie chan)', '\\(|\\)|(|)', ' ')

乍一看好像很复杂。。

实际上还好。

\\(|\\)|(|)' 其实可以看作 \\( | \\) | (|) 也就是\\( = ( ，\\)=) ，|=或的意思，(|)这个是啥呢？经过我测试(|)=()=两个字符中间没有空的那个没空，验证如下

——————————————————————————————————————————

顺道学习点函数

split_part

select split_part('one***two***three','***',2);
+-------------------------------------------+
| split_part('one***two***three', '***', 2) |
+-------------------------------------------+
| two                                       |
+-------------------------------------------+

select split_part('one\|/two\|/three','\|/',3);
+-------------------------------------------+
| split_part('one\|/two\|/three', '\|/', 3) |
+-------------------------------------------+
| three                                     |
+-------------------------------------------+

translate

select translate ('hello world','world','earth');

+--------------------------------------------+
| translate('hello world', 'world', 'earth') |
+--------------------------------------------+
| hetta earth |
+--------------------------------------------+

我有另外一篇文章专门解释translate 暂不说了。

说下其他的中文乱码，但是replace 是可以的。暂无解决办法

--未完待续

cclovezbf

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
impala查询转义问题

select REGEXP_REPLACE('佰分贰拾(深圳)品牌管理有限公司', '\\(', '（')然后SELECT vendor_full_name,REGEXP_REPLACE(vendor_full_name, '\\(', '（')FROM odsmdmdata.sms_vendor_party_t报错，这就日了狗了仔细看报错日志我就两个\\ 怎么就被转义成4个\\了所以我只用一个\就好SELECT vendor_full_name,REGEXP_REP...
复制链接

扫一扫