- 博客(3)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 HiveSQL动态实现多行区间分组维度
工作中接到一个报表需求,需要根据用户的授信额度,动态统计各个额度分段的人数例如:维度,[0,500),主要思路是使用爆炸函数posexplode如果你也遇到类似的需求,代码直接copy复用即可。
2023-03-17 11:56:32
563
原创 Hive自定义加解密udf、udtf函数部分失效问题
例如:业务库的手机号、身份证等敏感信息在落入数仓表前都需要进行加密后再进行存储;特定场景下业务人员会再将加密后的敏感信息进行解密后进行分析。会存在加密后数据变为空值,或者解密后数据变为空值的情况。例如:当遇到流量高峰,或者其他异常请求情况,代码逻辑中会返回空值。比如一次性加解密的数据量过大,会产生大量的请求,会存在流量异常的情况,导致返回空值。例如:每天跑批加密的时候,限制一下数据量;为了防止可能还会出现空值,可以进行二次加密,即对于第一步未加密成功的数据再次加密。
2022-11-30 16:08:03
745
原创 Hive on Spark 的bigint类型与datedifff返回值精度丢失问题
Hive on Spark 的bigint类型与datedifff返回值精度丢失问题
2022-09-15 17:41:31
744
mysql MGR官方文档(京东翻译)
2019-01-23
R七种武器之plyr第一部分(视频)
2018-07-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人