hive
文章平均质量分 71
小王是个弟弟
个人博客 https://uhope.fun
展开
-
Hive-因精度丢失导致的 join 数据异常
这篇文章介绍了Hive在处理join操作时由于精度丢失导致的数据异常问题。作者通过实例展示了在join操作中,即使两个join key明显不相等,Hive也可能将其匹配,这是因为Hive在执行计划中默认会对不同类型的key进行UDFToDouble转换,导致精度丢失。文章指出了这个问题,并提出了需要从执行计划的角度去理解和解决这类问题。原创 2024-05-31 14:22:07 · 524 阅读 · 0 评论 -
构建 hive 时间维表
告别 hive 繁琐的时间处理原创 2023-10-31 21:54:56 · 830 阅读 · 0 评论 -
拓展 hive 权限功能
实现 hiveserver2 用户名密码登录功能原创 2022-07-21 17:38:42 · 1009 阅读 · 0 评论 -
hive之事务表
hive 事务表原创 2021-05-14 14:53:43 · 3544 阅读 · 0 评论 -
hive打开计算引擎session卡死
平台:H3C DataEngine表现形式:启动hive shell第一次执行走计算流程的sql时,打开计算引擎的session时卡死,可视化查看任务正常提交,就是无法执行。原因解释:无论什么yarn调度器默认都是单队列,H3C使用的是公平调度器,但队列中存在其他正在执行的任务导致队列资源占用达到10%,导致后面的任务需要等待前面的任务走完,卡死的根本原因是安装了spark,导致后台会启动spark session且一直运行,导致之后的任务无法提交。解决方案:配置yarn多队列<?xml .原创 2020-12-06 23:13:26 · 1429 阅读 · 11 评论 -
Hive加载数据报相关权限问题
1.上传文件到linux文件系统[root@node1 mydata]# lltotal 129648-rw-r--r--. 1 root root 120734753 Dec 6 12:53 bigtable.bigtable-rw-r--r--. 1 root root 12018355 Dec 6 12:51 smalltable.smalltable2.加载数据到hive创建表create table bigtable( id int, time string, sess原创 2020-12-06 22:55:23 · 2928 阅读 · 0 评论