Hadoop运维和Hive调优

6 篇文章 0 订阅
1 篇文章 0 订阅
1.  高级运维  ——  各种服务

– HttpFS(HDFS over HTTP)
• http://host:14000/webhdfs/v1/?op=xxx&user.name=hdfs 

– HA 

• http://www.cloudera.com/content/cloudera-content/cloudera- docs/CDH5/latest/CDH5-High-Availability-Guide/CDH5-High- Availability-Guide.html 

– DistCp 

• hftp
– hadoop distcp hftp://oldHDFS:50070/ hdfs://newHDFS:8020/ 

– Cache 

• Centralized Cache Management in HDFS 

– NFS 

sudo service portmap stop
sudo hdfs portmap 2>~/portmap.err & sudo -u hdfs hdfs nfs3 2>~/nfs3.err & 

rpcinfo -p xxx.xxx.xxx.xxx showmount -e xxx.xxx.xxx.xxx 

sudo mount -t nfs -o vers=3,proto=tcp,nolock $HOSTNAME:/ /mnt/hdfs 


2.hive 调优

reducer个数
• hive.exec.reducers.bytes.per.reducer • mapred.reduce.tasks=-1 

› 权限问题
• hive.warehouse.subdir.inherit.perms 

› HiveServer2内存问题
– 设置-Xmx越大越好。。。 

• -Xmx=2048m 甚至 -Xmx=4g 

› 关闭“推测式”任务
• hive.mapred.reduce.tasks.speculative.execution • mapreduce.reduce.speculative 

› 客户端
• hive.cli.print.current.db 

• hive.cli.print.header

并行执行!

• hive.exec.parallel 

• hive.exec.parallel.thread.number 

› MapJoin
• hive.auto.convert.join 

• hive.mapjoin.smalltable.filesize
• hive.mapjoin.followby.gby.localtask.max.memory.usage=0.55 • hive.mapjoin.followby.map.aggr.hash.percentmemory=0.3
• hive.mapjoin.localtask.max.memory.usage=0.9 

• hive.ignore.mapjoin.hint 

› Local Mode
• hive.exec.mode.local.auto
• hive.exec.mode.local.auto.input.files.max • hive.exec.mode.local.auto.inputbytes.max 



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值