Hadoop
文章平均质量分 77
wingkoo1986
这个作者很懒,什么都没留下…
展开
-
第一章 Apache Hadoop的介绍
1,什么是Hadoop它是一个可靠的,可扩展,分布式计算的开源软件。2,Hadoop四大模块1. Hadoop Common: 公共工具模块,支持其它模块。2. Hadoop Distributed File System(HDFS™): 一个分布式文件系统,提供了高吞吐的访问应用数据。3. Hadoop YARN: 一个JOB调原创 2015-05-26 00:54:29 · 635 阅读 · 0 评论 -
第二章 Apache Hadoop2 linux下的编译
1, 如何安装1.1 下载完Hadoop源码后,请解压Hadoop, 找到BUILDING.txt文件打开它,这里详细讲解的安装的过程。(E:\hadoop-2.7.0-src)2, 安装必要软件(Lunix)2.1 JDK安装,这里不介绍了,如果不会的请先学习JAVA后,再学习Hadoop。2.2Maven安装请查看另一篇博客http://blog.csdn.原创 2015-09-07 20:56:29 · 363 阅读 · 0 评论 -
第三章 HDFS
1. HDFS有三部分组成分别是NameNode, DataNode,SecondNameNode。1.1 其设计理念:存储大数据(GB,TB,PB级别的)1) 优点:高容错性:数据有多个副本;副本丢失,自动恢复。适合批量处理:移动计算而非数据。适合大数据处理流式文件访问:一次写入,多次读取;保证数据的一致性。可在廉价的机器上部署。2) 缺点:低延迟:即是原创 2015-11-20 00:22:46 · 475 阅读 · 0 评论