一、概述
Hadoop这个名字的由来是Hadoopde之父Doug Cutting的孩子给一个棕黄色大象样子的玩具起的名字
Hadoop官网地址 http:// hadoop.apache.org/
什么是Hadoop?
官网原话:The Apache™ Hadoop® project develops open-source software for reliable, scalable, distributed computing.
翻译过来:Apache的Hadoop项目是一个可靠的,可拓展的分布式计算开源软件
Hadoop 的功能是利用服务器集群,根据用户自定义业务逻辑对海量数据进行分布式处理。它包括四个核心部分:Hadoop Common、Hadoop Distributed File System(HDFS)、Hadoop YARN、Hadoop MapReduce。
- Hadoop Commmon:支持其他Hadoop模块的通用功能
- HDFS:分布式文件系统,可提供对应用程序数据的高吞吐量访问
- Hadoop YARN:作业调度和集群资源管理的框架
- Hadoop MapReduce:基于YARN的并行处理大型数据集的框架
狭义Had