(1) HDFS是在最底层,YARN(MapReduce)和HBASE都依赖于HDFS。
(2) Hive、pig、Oozie都是一些额外的工具;hive将SQL语句转化成MapReduce程序;Oozie是任务调度,假设有10个任务,每个任务什么时候运行,由它帮我处理好。
(3) HBASE是分布式的数据库,他也是依赖HDFS的,HBase的数据本质是存放在HDFS上。
(4) sqoop(Sql和Hadoop2个单词的组成),复杂从关系型数据库中采集数据到HDFS中。
(5) flume的功能和sqoop也是一样的,都是数据采集,从日志文件中采取的。
(6) 唯一的‘一个人’,为这些动物提供服务的。ZooKeeper框架是为其他框架提供服务的。
Hadoop生态系统
最新推荐文章于 2024-10-04 18:47:42 发布