Hadoop之Hadoop的前世今生,适合什么场景?

Hadoop作为大数据的代表,源于Google的GFS论文,是一个可扩展的分布式计算框架。它包括HDFS、MapReduce和Yarn三部分,适用于处理和存储大规模数据。在选择版本时,要考虑研发能力和性能需求,常见的版本有V2和V3。后续将深入探讨Hadoop的各个组件。
摘要由CSDN通过智能技术生成

一提大数据,人们就想到Hadoop。Hadoop基本上成为了大数据的代言人了。那Hadoop到底是什么?用于解决什么问题?

hadoop的起源背景

HDFS源自于Goole的GFS论文(发表于2003年10月),HDFS是GFS的克隆版。

PS: 近些年和google相关的几个开源产品对软件进步影响还是挺大的,比如:移动应用圈的Android、大数据圈的Hadoop、云原生圈的Kubernetes。这是众多计算机牛人喜欢google的很大的一个原因吧

 

hadoop的定义(或叫 定位)

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。

两大特点:易于扩展的分布式文件系统(可支撑存储和计算);通过容错机制,可稳定运行在大量普通廉价的机器上。

 

hadoop目前的三个版本

版本号 版本信息 版本特点
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值