- 博客(3)
- 资源 (11)
- 收藏
- 关注
原创 hadoop基础(三)—YARN的架构
YARN概述 Yarn本来只是MapReduce的一部分,后来变成了Hadoop一个独立的项目 概括来说,Hadoop YARN的目的是使得Hadoop数据处理能力超越MapReduce。众所周知,Hadoop HDFS是Hadoop的数据存储层,Hadoop MapReduce是数据处理层。然而,MapReduce已经不能满足今天广泛的数据处理需求,如实时/准实时计算,图计算等。而...
2018-02-24 07:49:04 1128
原创 hadoop基础(二)—HDFS的架构
HDFS概述 它的设计目标是把超大数据集存储到分布在网络中的多台普通商用计算机上,并且能够提供高可靠性和高吞吐量的服务。分布式文件系统要比普通磁盘文件系统复杂,因为它要引入网络编程,分布式文件系统要容忍节点故障也是一个很大的挑战。HDFS最初是作为Apache Nutch Web搜索引擎项目的基础架构构建的。HDFS是Apache Hadoop Core项目的一部分。http://hado
2018-02-05 23:27:07 344
原创 hadoop基础(一)—初识hadoop
haoop的起源 Hadoop是Apache软件基金会的顶级开源项目,是由原雅虎公司Doug Cutting根据Google发布的学术论文而创建的开源项目。Doug Cutting被称为Hadoop之父,他打造了目前在云计算和大数据领域里如日中天的Hadoop。 Hadoop的发音是[hædu:p],Hadoop 这个名字不是一个缩写,而是一个虚构的名字。Doug Cutting解释
2018-02-05 23:17:26 476
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人