HDFS总结

目录

HDFS的组成

NameNode

DataNode

SecondaryNameNode

HDFS的操作

HDFS的命令行操作

Java API操作


hadoop分布式文件存储系统,用来解决海量数据的存储问题

HDFS的组成------核心配置文件:hdfs-site.xml、core-site.xml

NameNode:负责整个HDFS集群的管理(比如监控DataNode的运行状态、调度DataNode去处理数据);存储元数据(包含数据的基本信息,有两个重要文件:fsimage, editsfsimage, edits)

  • core-site.xml中:
    • fs.defaultFS-------用于指定NameNode的地址;
    • hadoop.tmp.dir----指定HDFS集群中相关文件存储的目录
  • hdfs-site.xml中:
    • dfs.namenode.name.dir------明确指定NameNode的镜像文件和日志文件等应该在什么路径下,如果不配置,则默认在hadoop.tmp.dir配置的目录的dfs/name下
    • dfs.namenode.http-address---------(0.0.0.0:50070)用来配置NameNode的外部访问端口号

DataNode:负责整个集群的数据存储(数据就是以文件存储的),底层是以block块去存储数据的,一个block块默认128M

  • hdfs-site.xml:
    • dfs.replication------配置block块的副本数,默认是3
    • dfs.namenode.heartbeat.recheck-interval-------NameNode检测DataNode状态的间隔时间,默认是5分钟,单位是ms
    • dfs.heartbeat.interval--------NameNode和DataNode的心跳时间,默认是3秒
    • dfs.datanode.data.dir-------用来指定DataNode中存储的block块的存放在Linux上的路径,默认在hadoop.tmp.dir/dfs/data目录下
    • dfs.namenode.datanode.registration.ip-hostname-check---
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值