UDF
文章平均质量分 53
不吃鱼的cat
喜欢是不可超越的力量
展开
-
hive之反斜杠导致Unicode编码字段里的中文无法正常显示
hive之反斜杠导致Unicode编码字段里的中文无法正常显示从mysql拉到hive的ods的表中字段显示不正常,如下content字段中文无法显示首先利用在线unicode解析看下具体的中文内容是什么**初始判定问题原因:**此时暂时判定是因为hive没有成功将“unicode”编码格式的字段转化为“utf-8”,故而无法正常显示因为没有找到合适的函数进行转码,所以自定义UDF,如下import org.apache.commons.lang3.StringEscapeUtils;i原创 2022-02-15 11:40:23 · 2579 阅读 · 9 评论 -
自定义UDF之自定义标识分组
**自定义UDF之自定义标识分组**功能:根据字段匹配自行分组首先添加maven依赖,我使用的hive版本是2.3.5,根据自己需求自己更改版本<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:sche原创 2021-11-21 21:53:14 · 878 阅读 · 0 评论