总结篇6——分布式系统

ye_jr_zi

于 2023-08-29 19:56:48 发布

阅读量43

点赞数

分类专栏： java 文章标签： java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ye_jr_zi/article/details/132568651

版权

java 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

分布式

概述
分布式平台 Hadoop
HDFS
MapReduce

概述

分布式系统作为一个整体对用户提供服务，而整个系统的内部协作对于用户来说是一个黑盒子。

在这里插入图片描述

分布式平台 Hadoop

特性：

高可靠
高效
高可扩展
高容错
底层本
成熟生态圈

核心组件

HDFS：将文件切分成指定大小的数据块并以多副本的方式存储在多个机器上。
MapReduce：分布式计算模型，完成海量数据离线处理
Yarn：负责整个集群资源的管理和调度

生态系统

在这里插入图片描述

组件	功能
HDFS	分布式文件系统，进行分布式存储
MapReduce	分布式并行编程模型
YARN	资源管理和调度器
Zookeeper	提供分布式协调一致性服务
Hive	Hadoop上的数据仓库，将SQL语句转化为Hadoop任务取执行，降低了使用Hadoop的门槛
HBase	Hadoop上的非关系型的分布式数据库
Kafka	一种高吞吐量的分布式发布订阅消息的系统，可以处理消费者规模的网站中的所有动作数据流
Sqoop	用于在Hadoop与传统数据库之间进行数据传递
Flume	一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统
Stom	流计算框架
Spark	类似于Hadoop的MapReduce的通用并行框架

HDFS

分布式文件系统
块（block）：HDFS的文件被分成块以副本的形式存储在多个节点上。
HDFS中的两类节点：
NameNode：管理节点，存放文件的元数据
DataNode：工作节点，存放数据块

MapReduce

采用分而治之的思想，把对大规模数据集的操作，分发给一个主节点管理下的各个子节点共同完成。
MapReduce框架采用了Master/Slave架构，包括一个Master和若干个Slave。
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
总结篇6——分布式系统

分布式系统作为一个整体对用户提供服务，而整个系统的内部协作对于用户来说是一个黑盒子。
复制链接

扫一扫

专栏目录

ye_jr_zi

CSDN认证博客专家 CSDN认证企业博客

码龄5年

31: 原创

4万+: 周排名

225万+: 总排名

4688: 访问

: 等级

337: 积分

2: 粉丝

4: 获赞

1: 评论

23: 收藏

私信

关注

热门文章

分类专栏

大数据
java 25篇
算法
R语言 1篇
c++ 6篇
STL 1篇

最新评论

运算符和流程控制
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。