看了大数据的学习路线差点晕倒了，这么多主流开源框架

最新推荐文章于 2024-08-13 08:54:02 发布

爱开发V

最新推荐文章于 2024-08-13 08:54:02 发布

阅读量178

点赞数

文章标签：分布式数据库 hadoop 大数据 spark

原文链接：https://mp.weixin.qq.com/s?__biz=MzAwODQ5MTA2NQ==&mid=2650854604&idx=1&sn=18d41c34895d6a36a462e7aa834845f6&chksm=809a6d9ab7ede48ca30e9f2faa9a673a66e51b89c7e5194b545586ac320ea5e41826bdb28b52&scene=126&&sessionid=0

版权

看了大数据的学习路线差点晕倒了，这么多主流开源框架要学习，Hive、Spark、Hbase、Presto、Flink、Druid、ClickHouse 、Impala、Kylin、Kafka、Kudu等主流开源大数据计算框架。还有Python

还有Hadoop集群。

HDFS：分布式存储系统，包含NameNode，DataNode。NameNode：元数据，DataNode。DataNode：存储数据。

yarn：可以理解为MapReduce的协调机制，本质就是Hadoop的处理分析机制，分为ResourceManager NodeManager。

MapReduce：软件框架，编写程序。

Hive：数据仓库可以用SQL查询，可以运行Map/Reduce程序。

HBase：数据库。非常适合用来做大数据的实时查询。

ZooKeeper：针对大型分布式的可靠性协调系统。Hadoop的分布式同步等靠Zookeeper实现，例如多个NameNode，active standby切换。

Sqoop：数据库相互转移，关系型数据库和HDFS相互转移

Chukwa：开源收集系统，监视大型分布式系统，建立在HDFS和Map/Reduce框架之上。显示、监视、分析结果。

Ambari：用于配置、管理和监视Hadoop集群。

看到这些学习清单，差点晕倒了，实在太多了。

-END-

猜你感兴趣

你简历上写着有分布式开发经验，怎么对缓存雪崩不了解？

微信公众号：爱开发

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
看了大数据的学习路线差点晕倒了，这么多主流开源框架

看了大数据的学习路线差点晕倒了，这么多主流开源框架要学习，Hive、Spark、Hbase、Presto、Flink、Druid、ClickHouse 、Impala、Kylin、Kafk...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。