hive
陆尼
技术分享,技术交流
展开
-
python实现hive中的表写入clinkhouse中
python实现hive中的表写入clinkhouse中。原创 2023-10-12 09:48:03 · 333 阅读 · 0 评论 -
hive亿级别的数据比较 distinct、 group by、 row_number() 去重效率
随着互联网的发展,产生的数据量越来越大,重复的数据也会越来越多,选择合适的去重方式是我们所需要的;这里对比了1亿1千万的数据来进行测试,重复数量为1千万条,重复比约等于1比10;原创 2022-11-08 14:44:54 · 3590 阅读 · 0 评论 -
hive 创建分区表 删除分区表 插入分区表
hive 创建分区表 删除分区表 插入分区表原创 2022-10-18 15:25:22 · 1918 阅读 · 0 评论 -
Error: Could not open client transport with JDBC Uri: jdbc:hive2://解决连接beenline连接HiveServer2报错
beenline 连接hiveserver2 报错背景:ranger 整合cdh后。原创 2022-10-14 13:42:57 · 6199 阅读 · 0 评论