初识大数据(二)-----hadoop的核心原理

最新推荐文章于 2024-04-20 13:09:21 发布

归来少年Plus

最新推荐文章于 2024-04-20 13:09:21 发布

阅读量129

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41709748/article/details/105959925

版权

大数据专栏收录该内容

32 篇文章 1 订阅

订阅专栏

一、HDFS设计架构
1)块(Block)
固定大小的逻辑单元,HDFS的文件被分成块进行存储,HDFS块的默认大小是64M.块是文件存储处理的逻辑单元.

2)NameNode
是管理节点,存放文件的元数据
文件与数据块的映射表
数据块与数据节点的映射表

3)DataNode
是HDFS的工作节点,存放数据块
在这里插入图片描述
二、数据管理策略

1、每个数据库块3个副本,分布在两个机架内的3个节点.
在这里插入图片描述
2、DataNode定期向NameNode发送心跳信息

3、二级NameNode定期同步元数据映像文件和修改日志,NameNode发送故障时,备胎转正

三、HDFS的读写流程

1、HDFS的读取文件的流程
在这里插入图片描述
2、HDFS的写文件流程

四、HDFS特点
1、流式的数据访问(写一次,读多次)
2、数据冗余,硬件容错
3、存储大文件
4、适用性与局限性
1)适合数据批量读写,吞吐量高
2)适合一次写入,多次多写
3)不适合交互式应用,低延迟很难满足
4)不支持多用户并发写相同文件

五、MapReduce的原理
分而治之,一个大任务分成多个小的子任务(map),并行执行后,合并结果(reduce).比如一个100G的日志,处理的话,如下图所示
在这里插入图片描述
六、MapReduce的运行流程
1、Job & Task
一个Job可以拆分成多个Task,task可以分为MapTask和ReduceTask

JobTracker的角色
1、作业调度
2、分配任务,监控任务执行进度
3、监控TaskTracker的状态

TaskTracker 的作用
1、执行任务
2、汇报任务状态
在这里插入图片描述
七、MapReduce的容错机制

1、重复执行
重试执行4次失败之后,放弃执行
2、推测执行
对执行慢的重新起一个任务执行,将原进程停掉

如果想了解更多的大数据相关知识,请关注公众号:架构师Plus
在这里插入图片描述

归来少年Plus

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
初识大数据(二)-----hadoop的核心原理

一、HDFS设计架构1)块(Block)固定大小的逻辑单元,HDFS的文件被分成块进行存储,HDFS块的默认大小是64M.块是文件存储处理的逻辑单元.2)NameNode是管理节点,存放文件的元数据文件与数据块的映射表数据块与数据节点的映射表3)DataNode是HDFS的工作节点,存放数据块二、数据管理策略1、每个数据库块3个副本,分布在两个机架内的3个节点.2、Dat...
复制链接

扫一扫

专栏目录

归来少年Plus CSDN认证博客专家 CSDN认证企业博客

码龄6年

302: 原创

17万+: 周排名

8299: 总排名

63万+: 访问

: 等级

5355: 积分

697: 粉丝

717: 获赞

54: 评论

982: 收藏

私信

关注

热门文章

分类专栏

微服务 13篇
数据库 13篇
istio 22篇
架构 20篇
python 4篇
安全 4篇
性能优化 1篇
大数据 32篇
kafka 2篇
测试 1篇
MQ 6篇
开心一刻 1篇
电子相册部署
概 13篇
docke 20篇
linu 11篇
k8 27篇
haprox 1篇
java 32篇
openstack 1篇
开发技巧 4篇
go 1篇
Jenkins 1篇
前端 16篇

最新评论

ChatGPT/GLM API使用
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
阿里云ECS服务器安装docker
普通网友: 支持一下！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
使用java代码给Excel加水印，保真，新鲜出炉
leisdelta: xssfSheet.getCTWorksheet().addNewPicture().setId(pr.getId());==>这一句的方法车轮子都没提供了,不知道是不是版本的问题,没生效
go语言（22）---- range & select
白话机器学习: 文章内容通俗易懂，适合不同层次的读者。无论是初学者还是资深从业者，都能从中获得不同层次的收获
使用java代码给Excel加水印，保真，新鲜出炉
朕的爱妃呢: 确实预览没有水印了就

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。