工作中的技巧

最新推荐文章于 2019-05-22 15:59:05 发布

purisuit_knowledge

最新推荐文章于 2019-05-22 15:59:05 发布

阅读量212

点赞数

分类专栏： hadoop 文章标签：集群命令技巧

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/purisuit_knowledge/article/details/84025196

版权

hadoop 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1.3 MapReduce版本：

hadoop jar app.jar -D mapreduce.job.queuename=root.etl.distcp -D mapreduce.job.priority=HIGH

2、动态调整

如果是已经在运行中的任务，可以动态调整任务所属队列及其优先级。

2.1 调整优先级

hadoop1.0及以下版本：hadoop job -set-priority job_201707060942_6121418 VERY_HIGH

hadoop2.0及以上版本：yarn application -appId application_1478676388082_963529 -updatePriority VERY_HIGH

2.2 动态调整队列

hadoop2.0及以上版本可以通过下面命令

yarn application -movetoqueue application_1478676388082_963529 -queue root.etl

其中application_1478676388082_963529为yarn applition id，queue后跟的是需要move到的队列。

1. 查看spark shuffle时的数据倾斜，语句中的100是分区数量, deviceid是分区字段, 最终会得出每个分区对应的记录数

select partitionNum,count(1) from (select (hash(deviceid) % 100) + (if ((hash(deviceid) % 100) < 0, 100,0)) partitionNum from ota_events where logdate='20171022') a group by partitionNum;

2.然后根据偏斜的数据量级, 使用如下语句找出偏斜的字段值,

select deviceid,count(1) from ota_events where logdate='20171022' group by deviceid having count(1) > 100000;

查看集群存储资源等

hadoop fs -count -h hdfs://namenode.dfs.shbt.qihoo.net:9000/home/hdp-360osd/*

purisuit_knowledge

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

purisuit_knowledge CSDN认证博客专家 CSDN认证企业博客

码龄12年

47: 原创

7万+: 周排名

66万+: 总排名

15万+: 访问

: 等级

2065: 积分

32: 粉丝

59: 获赞

11: 评论

239: 收藏

私信

关注

热门文章

分类专栏

hadoop 9篇
linux 2篇
python 4篇
hive-hbase整合 1篇
hbase
其它 7篇
hive 16篇
大数据框架 5篇
nutch学习 1篇
spark 23篇
服务器 4篇
搜索学习 2篇
scala 7篇
java 39篇
前台 1篇
mysql 2篇
kafka 3篇
机器学习 6篇
Web 1篇
spring 3篇
elastic-job 1篇
log4j 2篇
Git 1篇
nginx 1篇
http 1篇
kylin 1篇
Durid 1篇
Flink 3篇
YARN 1篇
设计模式 1篇

最新评论

Hive的Transform功能以及Transform的坑
xiamuyingu: 你好博主，我测试了 transform 功能，报错，查阅官方文档，信息是 The TRANSFORM clause is disallowed when SQL standard based authorization is configured in Hive 0.13.0 and later releases。请问这是不是说 0.13 之后的版本开启权限认证后，无法使用 transform 功能？我们这里使用了 ranger 权限认证
json格式的数据导入到hive表中
sly20135: 你好如果嵌套字典里面既含有string 类型的数据也含有array 类型的数据 ,此时map该如何写,比如这里 "religions":{"catholic":10,"protestant":[40,50]}
Apache Kafka编程入门指南：设置分区数和复制因子
purisuit_knowledge: 复制因子可以理解为数据备份数(副本数)
Apache Kafka编程入门指南：设置分区数和复制因子
行走的老熊: 博主，请教一下，topic的复制因子是什么？
spark参数调优
purisuit_knowledge 回复 weixin_42837510: 是的，有什么具体的问题，可以探讨

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。