hadooop-HDFS


一、

单机处理大数据

单机运行瓶颈在IO
查找重复行:hashCode
全排序:外排序,内排序
在这里插入图片描述

分布式处理

在这里插入图片描述

HDFS 模型架构

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

持久化原理

基于内存存储,都需持久化
在这里插入图片描述
在这里插入图片描述

数据持久化
日志文件:日志大,加载慢。
镜像:时间间隔,恢复速度快,文件缺失

HDFS:EditsLog:日志。FsImage:镜像,快照。最近时点的FsImage+增量的EditLog
在这里插入图片描述

在这里插入图片描述
非HA下,流程SNN
在这里插入图片描述

副本放置策略

在这里插入图片描述
NameNode触发副本放置策略
在这里插入图片描述
在这里插入图片描述


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值