1.Hadoop是什么?
开源的 分布式存储 分布式计算
2.核心部分
HDFS:(系统)分布式文件系统,用于存储海量的数据
MapReduce:(框架)并行处理框架,实现任务分解和调度
其他 :
HIV
HBASE (HDFS的区别,它可以提供数据的随机读写和实时访问,实现对表数据的读写功能)
zookeeper (监控,维护)
3.优势
1.高扩展
2.低成本
3.成熟的生态圈
4.HDFS
4.1基本概念
块(Block):HDFS的文件都被分成块进行存储,默认大小64MB
NameNode:管理节点,存放文件元数据
①文件与数据块的映射表
②数据库与数据节点的映射表