大数据工具之HIVE-参数调优,调度乱码(二)

梦想一直在路上

已于 2024-05-22 15:25:25 修改

阅读量362

点赞数 3

文章标签：大数据 hive hadoop

于 2024-05-22 15:25:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wb_zjp283121/article/details/139121101

版权

一、调度乱码

在利用HUE工具,搭建WORKFLOW流程的过程中,如果直接执行hivesql数据正常,不会出现乱码现象,如果利用WORKFLOW搭建的流程,进行数据的拉取,会出现数据中文乱码现象,这些乱码主要是由于select 中的硬编码中文导致出现的现象

具体现象如下:

select

case

when a = '' then '中国'

类似这种编码,导致的结果是:

解决方案：

在利用workflow搭建的流程中进行如下配置处理

在配置调度时,添加配置:
key: yarn.app.mapreduce.am.admin-command-opts
value: -Dfile.encoding=UTF-8

具体位置:

二、Hive 卡在map = 0%, reduce = 0%阶段

Hive 卡在map = 0%, reduce = 0%阶段

解决：增加map个数，设置mapreduce.input.fileinputformat.split.maxsize 小于系统默认值，需要综合考虑调用更多map时候的消耗

定位时发现任务卡在map = 0%, reduce = 0%阶段，而且发现map分配数量很少，所以猜测分配map较慢，增加map数量可解决问题。

原因：分配map数量少，一个map处理的数据多，处理速度慢

解决：增加map的数据

具体现象：

梦想一直在路上

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
大数据工具之HIVE-参数调优,调度乱码(二)

在利用HUE工具,搭建WORKFLOW流程的过程中,如果直接执行hivesql数据正常,不会出现乱码现象,如果利用WORKFLOW搭建的流程,进行数据的拉取,会出现数据中文乱码现象,这些乱码主要是由于select 中的硬编码中文导致出现的现象。定位时发现任务卡在map = 0%, reduce = 0%阶段，而且发现map分配数量很少，所以猜测分配map较慢，增加map数量可解决问题。二、Hive 卡在map = 0%, reduce = 0%阶段。在利用workflow搭建的流程中进行如下配置处理。
复制链接

扫一扫

梦想一直在路上 CSDN认证博客专家 CSDN认证企业博客

码龄7年

414: 原创

1万+: 周排名

3248: 总排名

61万+: 访问

: 等级

9286: 积分

289: 粉丝

399: 获赞

75: 评论

795: 收藏

私信

关注

热门文章

分类专栏

最新评论

大数据之Schedule调度错误(一)
chatGPT_gaga: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
mysql-读写分离，导致数据不一致问题
嗨森bao: 图片丢失了
Java之List集合两种排序的性能比较(抛开数据量谈性能都是耍流氓)
是奉壹啊: 你这个样本应该要用两个list吧，或者第2次排序之前要打乱
责任链设计模式
CSDN-Ada助手: 感谢您的分享，责任链设计模式是一种非常实用的设计模式，对于软件开发中的“解耦”非常有帮助。我们鼓励您继续分享您的技术，为CSDN社区贡献更多有价值的内容。作为下一步的建议，我们希望您可以撰写一篇关于“单例模式”的技术博文，分享您的实战经验和心得。期待您的精彩文章！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
多线程-批量获取多条线程的执行结果
wwj-肩并肩的默契: 三个程序都有问题，最后一个拿不到结果

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。