大数据生态圈到底有哪些，该如何学习

最新推荐文章于 2024-05-15 09:21:19 发布

ysjh0014

最新推荐文章于 2024-05-15 09:21:19 发布

阅读量2.6k

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ys_230014/article/details/82829450

版权

大数据专栏收录该内容

158 篇文章 4 订阅

订阅专栏

也是刚开始接触大数据，学习了一些大数据的框架，但是对于大数据生态圈的界限和分类一直不是很清楚

今天就对于这个大数据生态圈来做一个总结：

1.从生态圈来说

Hadoop生态圈

Spark生态圈

Storm

Hadoop生态圈和Spark生态圈实际上有些东西是相互依存的，都能适用于各自的生态圈，只不过他们处理的任务不一样，比如Kafka，HBase等等都能整合到Spark中使用

2.从任务类型来说

离线(批处理)

实时(流处理)

Hadoop是用来做离线任务处理的，Spark是既能做离线任务又能做实时任务的处理，其中Spark Streaming是用来实时处理数据的，但是Spark Streaming只是一定意义上的实时，实际是很小的批量处理，而Storm则是真正意义上的实时流处理系统，来一条数据就会处理一条数据

3.从语言上来说

Java

Scala

Python

Go

大数据的大多数框架都是用Java编写的，这样编程的时候用Java自然能更简单，Storm也是用Java实现的

Spark生态圈是用Scala来实现的，Scala的语法简洁，代码量少

Python已经作为作为AI时代的首选语言，而且Spark也支持Python

Go语言是为大数据分布式而生的，Docker，K8S都是由Go打造的

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大数据生态圈到底有哪些，该如何学习

也是刚开始接触大数据，学习了一些大数据的框架，但是对于大数据生态圈的界限和分类一直不是很清楚今天就对于这个大数据生态圈来做一个总结：1.从生态圈来说 Hadoop生态圈 Spark生态圈 StormHadoop生态圈和Spark生态圈实际上有些东西是相互依存的，都能适用于各自的生态圈，只不过他们处理的任务不一样，比如Kafka，HB...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。