一提大数据,人们就想到Hadoop。Hadoop基本上成为了大数据的代言人了。那Hadoop到底是什么?用于解决什么问题?
hadoop的起源背景
HDFS源自于Goole的GFS论文(发表于2003年10月),HDFS是GFS的克隆版。
PS: 近些年和google相关的几个开源产品对软件进步影响还是挺大的,比如:移动应用圈的Android、大数据圈的Hadoop、云原生圈的Kubernetes。这是众多计算机牛人喜欢google的很大的一个原因吧 |
hadoop的定义(或叫 定位)
Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。
两大特点:易于扩展的分布式文件系统(可支撑存储和计算);通过容错机制,可稳定运行在大量普通廉价的机器上。
hadoop目前的三个版本
版本号 | 版本信息 | 版本特点 |