Hadoop生态系统(简述)
HDFS
:作为Hadoop生态系统中数据的存储方案(文件系统)。
MapReduce
:Hadoop中分布式计算框架,对海量数据做并行分析计算。
Hbase
:基于HDFS的列式存储的NOSQL。
Hive
:是一款SQL解释引擎,能够将SQL语句翻译成MR代码。
Flume
:分布式的日至采集系统,用于收集海量日志数据,保存至存储系统。
kafka
:消息队列,实现分布式应用程序间的解耦和。
zookeper
:分布式协调服务,用户注册中心、配置中心、集群选举。