Hadoop
文章平均质量分 86
走出自己的未来
这个作者很懒,什么都没留下…
展开
-
初识Hadoop
hadoop概念: Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 核心组件: 1、Hadoop Common,是Hadoop的基础工具类库,为其他模块提供通用工具 2、Hadoop Distributed File System(HDFS),分布式文件存储系统,可以存储海量数据 3、Hadoop YARN,是Hadoop...原创 2018-07-30 23:07:38 · 2291 阅读 · 1 评论 -
Hadoop核心--HDFS
什么是HDFS? HDFS(Hadoop Distributed File System),分布式文件存储系统。源自于Google的GFS论文,是GFS的克隆版。与其他分布式文件系统相比,它具有很高的容错能力,适合部署在廉价的机器上;另外它能提供高吞吐量的数据访问,适合海量数据的存储。 HDFS特点 易于扩展 运行在普通廉价的机器上,提供容错机制 为大量用户提供高性能的海...原创 2018-08-05 22:36:59 · 503 阅读 · 2 评论