HDFS、MR、Kafka、Storm、Spark、Hbase、Redis原理图

HDFS、MR、Kafka、Storm、Spark、Hbase、Redis原理图

1、大数据分析阶段图

这里写图片描述

2、大数据分析平台总体架构

这里写图片描述

3、大数据分析平台技术栈

这里写图片描述

4、HDFS分布式存储原理图

这里写图片描述

5、MR计算原理图

这里写图片描述

这里写图片描述

6、Kafka分布式消息队列原理图

这里写图片描述

7、Storm分布式流式计算原理图

这里写图片描述

8、Spark内存计算原理图

这里写图片描述

9、Hbase列式存储数据库原理图

这里写图片描述

10、Redis

这里写图片描述

喜欢就点赞评论+关注吧

这里写图片描述

感谢阅读,希望能帮助到大家,谢谢大家的支持!

  • 5
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
1. Storm拓扑图: Storm是一个分布式实时计算系统,可以用来处理实时流数据。它的拓扑图如下: ![storm_topology](https://img-blog.csdn.net/20180419162840178?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hhdGJlcnJ5/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70) 解释: - Spout:数据源,可以接收外部的数据流,将数据发送给Bolt进行处理,常见的数据源有Kafka、RabbitMQ等。 - Bolt:计算节点,可以对接收到的数据进行各种处理操作,然后发送给下一个Bolt或者终止节点,常见的Bolt有过滤Bolt、聚合Bolt、计算Bolt等。 Storm的工作流程: 1. 数据源将数据发送给Spout。 2. Spout接收到数据后,发送给Bolt进行处理。 3. Bolt进行处理后,将处理结果发送给下一个Bolt或者终止节点。 4. 终止节点将处理结果输出。 2. Spark拓扑图: Spark是一个快速的大数据处理框架,可以用来处理批量数据和流式数据。它的拓扑图如下: ![spark_topology](https://img-blog.csdn.net/2018041916291420?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hhdGJlcnJ5/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70) 解释: - Input:数据源,可以是HDFS、本地文件、Kafka等。 - Transformation:转换节点,可以对接收到的数据进行各种转换操作,比如map、filter、reduce等。 - Output:输出节点,将转换后的结果输出,可以是HBase、MySQL、Redis等。 Spark的工作流程: 1. 数据源将数据发送给Input。 2. Input接收到数据后,将数据发送给Transformation进行转换。 3. Transformation进行转换后,将处理结果发送给Output进行输出。 3. Kafka拓扑图: Kafka是一个高吞吐量的分布式消息队列,可以用来处理流式数据。它的拓扑图如下: ![kafka_topology](https://img-blog.csdn.net/20180419162945502?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hhdGJlcnJ5/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70) 解释: - Producer:生产者,可以将消息发送到Kafka Broker上。 - Topic:主题,消息的分类标准。 - Partition:分区,可以将主题划分成多个分区,每个分区可以由多个Broker负责。 - Broker:Kafka服务器,可以负责多个分区。 - Consumer:消费者,可以从Broker上消费消息。 Kafka的工作流程: 1. Producer将消息发送到Kafka Broker上。 2. Kafka Broker接收到消息后,将消息存储到对应的Topic的Partition中。 3. Consumer从Kafka Broker上消费消息。 4. Hadoop拓扑图: Hadoop是一个分布式计算框架,可以用来处理大规模的数据。它的拓扑图如下: ![hadoop_topology](https://img-blog.csdn.net/20180419163014157?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hhdGJlcnJ5/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70) 解释: - HDFS:分布式文件系统,可以存储大规模的数据。 - MapReduce:分布式计算框架,可以对存储在HDFS上的数据进行计算。 Hadoop的工作流程: 1. 数据源将数据存储到HDFS上。 2. MapReduce对存储在HDFS上的数据进行计算。 3. 计算结果存储到HDFS上。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值