大数据技术栈概述

王雀跃

已于 2023-03-19 11:03:56 修改

阅读量1.5k

点赞数 1

分类专栏： big data 文章标签：大数据 hadoop hdfs 分布式

于 2023-02-05 12:44:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangshiqi666/article/details/128876964

版权

big data 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、Hadoop

1.1 Hadoop是什么？

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
主要解决，海量数据的存储和海量数据的分析计算问题。
广义上来说，Hadoop通常是指一个更广泛的概念——Hadoop生态圈。

1.2 Hadoop组成

1.2.1 HDFS

Hadoop Distributed File System，简称 HDFS，是一个分布式文件系统。

1.2.2 HDFS概述

1.2.3 HDFS优缺点

1.2.4 HDFS组成框架

1.2.5 HDFS文件块

1.3.1 Yarn

Yet Another Resource Negotiator 简称 YARN ，另一种资源协调者，是 Hadoop 的资源管理器。

1.3.2 YARN架构概述

1.4.1 MapReduce

MapReduce 将计算过程分为两个阶段：Map 和 Reduce

1）Map 阶段并行处理输入数据

2）Reduce 阶段对 Map 结果进行汇总

1.4.2 MapReduce 概述

1.4.3 MapReduce 优缺点

1.4.4 MapReduce 架构概述

1.3 HDFS、YARN、MapReduce 三者关系

二、Zookeeper(动物管理员)

2.1 概述

Zookeeper 是一个开源的分布式的，为分布式框架提供协调服务的 Apache 项目。

2.2 工作机制

2.3 特点

2.4 应用场景

2.5 zookeeper部分问题

三、Hive

3.1 概述(Hive 是为数据仓库而设计的)

3.2 优缺点

四、Sqoop

4.1 概述

4.2 原理

五、Scala(编程语言)

5.1 为何学Scala？

5.2 Scala特点

六、Spark(批处理数据)

6.1 什么是Spark

6.2 Spark和Hadoop关系

6.3 Spark和Hadoop如何选择

6.4 Spark核心模块

七、Flume

7.1 概述

7.2 flume架构

八、Kafka

8.1 定义

8.1.1 消息队列

8.1.2 消息队列应用场景

8.1.3 消息队列模式

8.2 kafka架构

九、Flink(流式处理数据)

Flink 是 Apache 基金会旗下的一个开源大数据处理框架。

Flink 是一个大数据流处理引擎，它可以为不同的行业提供大数据实时处理的解决方案。

9.1 Flink核心特性

9.2 Flink分层Api

9.3 相较于Spark，更推荐Flink处理实时流处理

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
1
评论
大数据技术栈概述

大数据用到的部分技术栈介绍
复制链接

扫一扫

专栏目录

博客等级

码龄2年

Java领域新星创作者

112
原创

247
点赞

475
收藏

3708
粉丝

关注

私信

热门文章

分类专栏

vue 2篇
Java 45篇
C语言 2篇
docker 5篇
MySql 19篇
linux 13篇
k8s 2篇
RabbitMQ 1篇
Dos命令窗口 2篇
JavaScript 2篇
big data 5篇
redis 2篇
scala 6篇
flink 4篇
html 2篇
Markdown 1篇

最新评论

MySQL根据出生日期计算年龄的五种方法比较
l3402: https://www.jianshu.com/p/64b53c26bea1
JavaScript中sort()函数
王雀跃: 阔以阔以
JavaScript中sort()函数
阿伟来咯~: a - b < 0: 代表后一个比前一个大，就是升序 b - a < 0: 代表前一个比后一个大，就是降序 a - b = 0 或 b - a = 0: 前后两个数相等 a和b没有说a是前一个，而b是后一个，通过打印a才是后一个
JavaScript中sort()函数
PitayaDog: 转发一个
MySQL获取当前日期、时间、时间戳函数
王雀跃: 我的是5.7

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

王雀跃 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。