Hadoop项目结构

 

参考自:http://www.icourse163.org/course/XMU-1002335004?tid=1003024012

 

HDFS

负责整个分布式文件的存储

 

YARN

负责调度内存CPU带宽等计算资源

 

MapReduce

负责离线计算和批处理

基于磁盘计算

 

Tez

将MapReduce作业进行分析优化,构成有向无环图(理清处理顺序,避免工作重复)

 

Spark

逻辑与MapReduce相同

基于内存计算,性能远高于MapReduce

 

Hive

基于Hadoop的数据仓库工具

支持SQL语言,将SQL语句转化为MapReduce作业后执行

Hive架构在MapReduce之上

 

Pig

基于Hadoop的大规模数据分析平台

提供类似SQL的查询语言Pig Latin

 

Oozie

工作流管理工具

 

Zookeeper

负责分布式协调服务(集群管理,分布式锁一致性)

 

HBase

分布式的、面向列的、适合非结构化数据存储的数据库

支持随机读写和实时应用

 

Flume

日志收集分析框架

 

Sqoop

用于Hadoop与传统数据库间进行数据的传输

 

Ambari

Hadoop快速部署工具

支持Apache Hadoop集群的供应、管理和监控

 

转载于:https://www.cnblogs.com/0nzh0/p/11057483.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值