1.Hadoop简介,特性,应用
Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供系统底层细节透明的分布式基础架构。
Hadoop是基于java语言开发的,具有很好的跨平台性,并且可以部署在廉价的计算机集群中。
Hadoop的核心:
Hadoop分布式文件系统(HDFS)
MapReduce
2.Hadoop的特性
1.高可靠性:采取冗余数据存储方式。即使一个副本发生故障,其他副本也可以保证正常对外提供服务。
2.高效性:采取分布式存储和分布式处理两大核心技术。能够高效的处理PB级数据。
3.高可扩展性:
4.高容错性:自动保存数据的多个副本,自动将失败的任务重新分配。
5.成本低
6.运行在Linux操作系统上
7.支持多种编程语言
3.Hadoop的生态系统