核心组成:
HDFS:分布式文件系统,存储海量数据;
MapReduce:并行处理框架,实现任务分解和调度;
能做什么?
大型数据仓库…..
优势1:
高扩展
低成本
成熟的生态圈:
Hadoop的应用范围较广:Facebook、Google等等;
Hadoop ecosystem 生态系统:
- Hive 将SQL转化为Hadoop任务,降低使用Hadoop的门槛;
- Hbase 存储结构化数据的数据(无事物特性),数据随机读写和实时访问
- zookeeper 监控Hadoop集群中节点的状态、集群的一致性;