狭义Hadoop
狭义上,Hadoop是一个分布式计算框架,主要包括以下四个模块:
- Hadoop Common: 通用工具类模块;
- HDFS: 分布式文件系统模块;
- YARN: 子群资源管理模块;
MapReduce: 数据批处理计算框架;
广义Hadoop
广义上,Hadoop是指大数据生态,如下图所示:
- Flume:海量日志收集系统;
- Sqoop:数据导入导出工具;
参考:
狭义上,Hadoop是一个分布式计算框架,主要包括以下四个模块:
MapReduce: 数据批处理计算框架;
广义上,Hadoop是指大数据生态,如下图所示:
参考: