HDFS细节整理

namenode启动过程
  • 开启安全模式 不能执行修改数据的操作
  • 加载fsimage
  • 逐个执行所有的Edits文件中的每一条操作将操作合并到fsimage 完成后生成一个空的edits文件
  • 接受datanode发送来的信息和块信息
  • 根据以上信息来确定文件系统状态
  • 退出安全模式
退出安全模式的条件
  • dfs.namenode.safemode.min.datanodes :最小可用的datanode数量 1
  • dfs.namenode.safemode.threshold-pct :副本数达到最小要求的block占系统总block数的百分比 %99.999
  • dfs.namenode.safemode.extension :稳定时间 30s
大量小文件问题
  • 定义: 大量大小小于块大小的文件
  • 网页,hive动态分区插入数据等
  • 背景:每个文件的元数据对象约占150byte ,所以如果有一千万个小文件,每个文件占用一个block,则需要namenode大约需要2G 空间
  • 影响 :占用资源 降低处理效率
  • 解决方案:
    1. 从源头减少小文件
    2. 使用archive 打包
    3. 使用其他储存方式,如Hbase,ES等

HDFS文件格式

内存预估

文件元数对象约占

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值