看了大数据的学习路线差点晕倒了,这么多主流开源框架

看了大数据的学习路线差点晕倒了,这么多主流开源框架要学习,Hive、Spark、Hbase、Presto、Flink、Druid、ClickHouse 、Impala、Kylin、Kafka、Kudu等主流开源大数据计算框架。还有Python

还有Hadoop集群。

HDFS:分布式存储系统,包含NameNode,DataNode。NameNode:元数据,DataNode。DataNode:存储数据。

yarn:可以理解为MapReduce的协调机制,本质就是Hadoop的处理分析机制,分为ResourceManager NodeManager。

MapReduce:软件框架,编写程序。

Hive:数据仓库 可以用SQL查询,可以运行Map/Reduce程序。

HBase:数据库。非常适合用来做大数据的实时查询。

ZooKeeper:针对大型分布式的可靠性协调系统。Hadoop的分布式同步等靠Zookeeper实现,例如多个NameNode,active standby切换。

Sqoop:数据库相互转移,关系型数据库和HDFS相互转移

Chukwa:开源收集系统,监视大型分布式系统,建立在HDFS和Map/Reduce框架之上。显示、监视、分析结果。

Ambari:用于配置、管理和监视Hadoop集群。

看到这些学习清单,差点晕倒了,实在太多了。

-END-

猜你感兴趣

你简历上写着有分布式开发经验,怎么对缓存雪崩不了解?

ce599344696abbb4c961c6a093c5e118.png

微信公众号:爱开发

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值