大数据-Hadoop的四大机制

最新推荐文章于 2023-12-14 10:17:13 发布

冒_冒

最新推荐文章于 2023-12-14 10:17:13 发布

阅读量224

点赞数

分类专栏：大数据文章标签：大数据 hadoop

本文链接：https://blog.csdn.net/qq_41847171/article/details/89243632

版权

大数据专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Hadoop四大机制

1.心跳机制

		** 心跳的报告信息:datanode块信息,存活状态
		** 每三秒datanode向namenode发送心跳信息
		** 连续10次未收到心跳信息,namenode会向datanode发送验证信息,10分钟一次,两次未响应,则datanode可能宕机了,时间是:3*10+300*2 = 630s

2.安全模式

集群启动顺序:namenode - datanode - secondarynamenode
集群在启动时，由于要加载元数据，集群自动处于自我保护状态，安全模式此模式下只能进行数据读的操作，任何可能更改元数据的操作都被禁止
手动进入安全模式命令: Hdfs dfsadmin -safemode enter/leave/get/wait
元数据包括:
1.抽象目录树
2.数据和块的对应关系
3.数据块的存储位置
集群在启动的过程中namenode需要:将硬盘的元数据加载到内存中,接受datanode的心跳报告

3.机架策略(副本存放策略)

1.默认两个机架,3个副本
2.第一个副本存放在客户端所在节点（前提是客户端是集群的某一个节点）
如果客户端不是集群中的一个节点，则任意存储
3.第二个副本存储在与第一副本存放节点不同的机架的任意节点上
4.第三个副本存储在与第二个副本相同机架的不同节点上
实际生产中：不同节点不同机架不同机房不同数据中心

4.负载均衡

1.系统会自动进行负载均衡,默认1M/s
2.手动负载均衡的方式:加大带宽,告诉系统及时进行负载均衡
```
  	命令: start -balancer.sh -t 10%
```

冒_冒

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据-Hadoop的四大机制

Hadoop四大机制1.心跳机制 ** 心跳的报告信息:datanode块信息,存活状态 ** 每三秒datanode向namenode发送心跳信息 ** 连续10次未收到心跳信息,namenode会向datanode发送验证信息,10分钟一次,两次未响应,则datanode可能宕机了,时间是:3*10+300*2 = 630s2.安全模式集群启动顺序:namenode -...
复制链接

扫一扫