大数据学习(二)，hadoop集群重要节点概述以及HDFS文件系统的原理

最新推荐文章于 2024-04-16 15:26:41 发布

VIP文章 _ 菜 -∞

最新推荐文章于 2024-04-16 15:26:41 发布

阅读量3.6k

点赞数 1

分类专栏：大数据文章标签：大数据分布式 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duchenlong/article/details/115603136

版权

hadoop集群

概述
分布式文件系统的结构
- 块
集群中的重要节点

概述

在介绍hadoop集群的重要节点之前，先举一个简单的例子说明一下：

场景就是，我们有一个网站，网站中有很多用户，每个用户都有自己的信息和动态等，那么对于这些信息，我们网站的后台都是需要记录的。

怎么记录呢，直接就根据用户的标号，放在一个文件夹里吧，然后存在磁盘中（或者放在数据库里，都可以）
在这里插入图片描述
然后呢，随着时间的发展，用户的数量越来越多，我们后台的一个服务器里可能存不下这么多的数据，这个时候两种方式：

给磁盘扩容
加机器

如果我们给磁盘扩容的方式去处理，但是是不是需要考虑到我们一个服务器的处理能力，这样虽然可以在同一台机器中存储下来，这样就意味着服务器在找一个资源的时候，需要花费的时间变长了，因为分母变大了，他的效率就会有点小
在这里插入图片描述

采用加机器的方式，利用Nginx这些技术，将不同用户的信息存储在多个服务器中，至于来了一个用户，怎么确定他的信息在哪里，就需要看后端的算法怎么写的了，可以使用哈希，也可以使用自己定义的规则，但是一定要让第二次请求用户信息时，可以找到第一个存储的位置

在这里插入图片描述

但是这样还是有着一些问题，就比如我中间的一些用户信息存储在服务器A，但是某一段时间服务器A突然宕机了，那么就意味着服务器A暂时无法提供数据。

这样该怎么解决呢，hadoop分布式存储中的一系列机制，就确保了数据的稳定

最低0.47元/天解锁文章

关注

1
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
大数据学习(二)，hadoop集群重要节点概述以及HDFS文件系统的原理

hadoop集群中的一些重要节点， NameNode，DataNode，JobTracker，TaskTracker，SecondaryNameNode的作用和意义，以及Hadoop分布式文件系统存储的原理，块的设计
复制链接

扫一扫

专栏目录

_ 菜 -∞ CSDN认证博客专家 CSDN认证企业博客

码龄6年

146: 原创

5万+: 周排名

65万+: 总排名

19万+: 访问

: 等级

3356: 积分

224: 粉丝

432: 获赞

169: 评论

1577: 收藏

私信

关注

热门文章

分类专栏

C/C++ 51篇
大数据 3篇
网络 12篇
python 3篇
题解 48篇
操作系统 22篇
数据库 7篇

最新评论

QT基于Npcap设计的网络抓包小程序
Go All Out.: 运行异常是为什么哎
基于VM虚拟机下Ubuntu系统，Hadoop的安装与详细配置
北辰星Charih: 无法访问Hadoop下载的地址：https://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.10.1/。
QT基于Npcap设计的网络抓包小程序
kennyS708: 大哥源代码又看不了咯跪求！
QT基于Npcap设计的网络抓包小程序
nftxbfq: 大佬有没有尝试过几十k的数据量抓取，试了一下完全没抓到，这要怎么改进那
C++求解斐波那契数列的若干方法
yangSHU21: 作者你好，方法四有一点不明白 if (n < 2) return n; int a = 0, b = 1, c; for (int i = 2; i <= n; i++) { c = (a + b) % mod; a = b; b = c; } return c; 为什么要设置初始值 a = 0, b = 1,呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。