hadoop生态系统组件目前的理解（先记录，有些地方理解不正确，后面修改）

最新推荐文章于 2024-04-12 06:40:12 发布

me_lawrence

最新推荐文章于 2024-04-12 06:40:12 发布

阅读量936

点赞数

分类专栏： hadoop ecosystem

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/onlyForCloud/article/details/49508345

版权

hadoop ecosystem 专栏收录该内容

25 篇文章 0 订阅

订阅专栏

本文详细介绍了Hadoop生态中的重要组件，包括YARN资源调度器、HDFS分布式文件系统、ZooKeeper协调服务、HBase分布式数据库、Hive数据仓库工具、Oozie工作流管理系统、Sqoop数据迁移工具、Hue交互式界面、Flume数据收集系统、Impala实时查询引擎以及Pig数据处理语言。通过对这些组件的学习，可以全面了解Hadoop集群的工作原理和应用。

摘要由CSDN通过智能技术生成

一，yarn

ResourceManager、Nodemanager、App Master。

ResourceManager拿到任务后，根据掌握的各个NodeManager的资源情况，决定在哪些主机上创建App Master。

各个App Master与本机的NodeManager申请Container后，在本机运行启动多个map和reduce。

Hadoop 新 MapReduce 框架 Yarn 详解

hadoop杂记-为什么会有Map-reduce v2 (Yarn)

YARN/MRv2 Resource Manager深入剖析—RM总体架构

二，hdfs

NameNode、SecondaryNameNode、DataNode。

NameNode就是Index的作用。没有什么好说的。如果有机器Down掉了，NameNode会从备用机架上的节点找出备份返回。

Hadoop中Namenode单点故障的解决方案分析

【HBase】图解 HDFS 工作原理

三，ZooKeeper

一致性服务的组件。

ZooKeeper典型应用场景

利用Zookeeper对HDFS中Namenode单点失败的改进方法

zookeeper原理

四，HBase

kv，只支持一级index。

Reference Guide

Hbase 使用方法

HBase在淘宝的应用和优化小结

HBase在腾讯大数据的应用实践

HBase在内容推荐引擎系统中的应用

HBase基本数据操作详解

Hbase的存储 Rowkey设计

HBase 系统架构

hbase shell基础和常用命令详解

五，Hive

用于数据仓库，表级别的处理。不建立索引，不是用来高速查询的。

hive应用实例

六，Oozie

多个Map Reduce程序的调度。配置xml。

七，Sqoop

主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。

利用SQOOP将数据从数据库导入到HDFS

八，Hue

Hadoop可视化分析利器之Hue

九，Flume

Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

flume 1.4的介绍及使用示例

应用Flume+HBase采集和存储日志数据

让你系统认识flume及安装和使用flume1.5传输数据到hadoop2.2

十，Impala

Impala入门笔记

十一，Pig

Apache Pig的一些基础概念及用法总结

Getting Started

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。