Hive
0Rows
这个作者很懒,什么都没留下…
展开
-
正则表达式收集
由来 工作中出现需要解析xml字段(字段为string型)取其中某几个指定节点内容的情况,但源数据中的字段保存的xml内容存在缺失,此时使用xpath或相关的函数会报错,用instr查找具体字段位置再用substr又过于麻烦,遂用正则表达式进行截取。 总体可以看作是用正则表达式取指定两个字符串中的值 例如: regexp_extract('<staff_name>fasdfasfasdf</staff_name>','(?<=\<staff_name\>).*?(?原创 2021-09-07 16:51:53 · 111 阅读 · 0 评论 -
hive 使用过程中遇到的问题记录
having count() 无法去重 having count(distinct columnA) 会报错columnA字段错误 having count(columnA) 正常原创 2020-07-06 11:24:08 · 292 阅读 · 0 评论