hbfs 基础理解和基础代码

apex_guagua

于 2021-07-07 23:21:10 发布

阅读量583

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/apex_guagua/article/details/118559907

版权

hdfs 分布式文件系统
mapreduce 大数据离线数据处理框架
yarn 统一资源管理和调度平台
hive 数据分析
sqoop 数据导入导出
hbase 大数据存储非关系型数据库
flume 日志采集系统
spark 实时流式数据计算框架

hdfs
架构原理配置使用
1.分布式文件系统和普通文件系统
2.hdfs中的几个组件，都有什么作用
namenode:存储文件的元数据，接收来自客户端的读写请求
datanode：存储文件数据
secondarynamenode：第二名字节点，定期的检查并且合并FSImage系统快照，editlog编辑日志
3.hdfs默认存储几块，每块大小、
3， 128M
4.seconderynamenode 和namenode之间的关系
SecondaryNameNode引导NameNode滚动更新编辑日志文件，并开始将新的内容写入EditLog.new.
SecondaryNameNode将NameNode的FSImage和编辑文件复制到本地的检查点的目录
SecondaryNameNode载入FSImage文件,回放编辑日志，将其合并到FSImage，将新的FSImage文件压缩后写入磁盘。
SecondaryNameNode将新的FSImage文件送回NameNode,NameNode在接收新的FSImage后，直接加载和应用该文件
NameNode将Edit Log.new更名为Edit Log

5.hdfs的容错机制
副本机制和心跳机制
6.hadoop 2.X 端口号是8020 1.X 版本端口是 9000
7.hdfs配置核心配置文件和配置内容

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hbfs 基础理解和基础代码

hdfs 分布式文件系统mapreduce 大数据离线数据处理框架yarn 统一资源管理和调度平台hive 数据分析sqoop 数据导入导出hbase 大数据存储非关系型数据库flume 日志采集系统spark 实时流式数据计算框架hdfs架构原理配置使用1.分布式文件系统和普通文件系统2.hdfs中的几个组件，都有什么作用namenode:存储文件的元数据，接收来自客户端的读写请求datanode：存储文件数据secondarynam...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。