![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Hive
文章平均质量分 58
Hive学习
木笔の园子
心有猛虎,细嗅蔷薇
展开
-
【Hive SQL】使用正则表达式做数据清洗
在操作大数据时,通常需要将某些数据进行清洗后再进行操作,某些不规则数据清洗需要用到正则表达式。正则表达式是一种匹配模式,可以进行字符匹配和位置匹配。原创 2021-07-01 14:53:31 · 1794 阅读 · 0 评论 -
Hive SQL报错:SemanticException [Error 10004]: Invalid table alias or column reference
Hive SQL报错:SemanticException [Error 10004]: Invalid table alias or column reference在python脚本中执行Hive SQLpython脚本如下:sql="""SELECTtest_url,(casewhen substring_index(test_url, '/', 1) == 'dev.test.com`:`1024/' then substr(test_url,25)when substring_inde原创 2021-06-10 15:03:15 · 13268 阅读 · 4 评论 -
Hive SQL踩坑记录-NULL判断、字符串拼接、执行报错:Expression not in GROUP BY key
记录在使用Hive SQL 过程中的错误信息【Hive SQL踩坑记录】对于NULL判断select last_visit_day, case when last_visit_day is NULL then datediff('2021-06-01', '2021-05-01') else COALESCE(datediff(stat_dt, last_visit_day), 0) end as consecutive_days_without_access from原创 2021-06-18 14:27:05 · 620 阅读 · 0 评论