本文主要包含以下3个部分:
1.什么是Hadoop?
2.Hadoop的特点。
3.Hadoop的核心组件。
1.什么是Hadoop
Hadoop是一个开源软件框架,该框架能够一种分布式的范式存储(storage)和处理(processing)大型数据集合。数据集合可以为结构化、半结构化和非结构化数据。可以接受的数据形式多种多样。Hadoop 框架执行Apache v2 许可。因此,Apache Hadoop 这个组合就容易理解啦。Hadoop 的开发是以Google Mapreduce 系统和函数化编程概念为基础,且是以Java语言编写。
2.Hadoop 特点
1.灵活性;
2.可靠性;
3.经济性;
4.可伸缩性;
3.Hadoop 核心组件
1.Hadoop Distributed Fils System(storage)(HDFS)
2.YARN(processing)(Yet Another Resource Negotiator)
本文图片均来源于原文:https://www.edureka.co/blog/hadoop-tutorial/