CDH参数

8 篇文章 0 订阅
7 篇文章 0 订阅

HDFS

  1. hdfs block存储位置:dfs.datanode.data.dir
  2. fsimage存储位置:dfs.namenode.name.dir
  3. edits log存储位置:dfs.namenode.edits.dir
  4. DN每块磁盘不能被hdfs使用的空间:dfs.datanode.du.reserved
    默认10GB,一般建议单盘空间25%
  5. bolck块大小:dfs.blocksize
  6. bolck副本数:dfs.replication
  7. fs.trash.interval:回收站清理时间周期,默认1天
  8. NN进程最大并发数,可以同时与多少个DN通信dfs.namenode.handler.count。Hadoop默认值10,CDH默认值30,建议ln(X)*20,X为HDFS节点数。
  9. DN磁盘坏了多少块,这个DN就下线:dfs.datanode.failed.volumes.tolerated。CDH默认0,意思坏多少块盘都不下线
    10.DN支持cache的大小:dfs.datanode.max.locked.memory ,CDH默认4GB,0代表禁用
    11.HDFS文件压缩格式的支持:io.compression.codecs

Yarn

  1. 日志汇聚功能:yarn.log-aggregation-enable
  2. 日志汇聚存储hdfs路径:yarn.nodemanager.remote-app-log-dir
  3. 日志写本地路径:yarn.nodemanager.log-dirs
    应用程序日志写本地路径,如果日志汇聚功能打开,应用完成后这些文件就会被删除
  4. 应用缓存文件存储路径:yarn.nodemanager.local-dirs
    MR、Spark计算中间过程产生的临时落盘数据存储位置,有时可能因为这个磁盘空间不足,导致应用报错

MapReduce

  1. mapreduce.job.reduce.slowstart.completemaps:CDH默认0.8,map整体进度完成多少百分比后,开始初始化reduce
  2. mapreduce.reduce.shuffle.parallelcopies:reducer进程最大并发打开线程数,来和mapper通信,CDH默认10,建议(ln(X)*4)/10,X为集群节点数
  3. mapreduce.map.speculative:预测执行,默认值False,推荐False
  4. mapreduce.reduce.speculative:预测执行,默认值False,推荐False
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值