Hadoop实战-初级部分
dpc27149
这个作者很懒,什么都没留下…
展开
-
Hadoop实战-初级部分 之 Hadoop Shell 基本操作介绍
第一部分:Hadoop Bin 后面根据项目的实际需要Hadoop Bin 包括: Hadoop hadoop的Shell hadoop-config.sh 它的作用是对一些变量进行赋值 HADOOP_HOME(hadoop的安装目录)。 HADOOP_CONF_DIR(hadoop的配置文件目录)。HADOOP_SLAVES(--hosts指定转载 2013-12-14 23:47:21 · 869 阅读 · 0 评论 -
Java线程池管理及分布式Hadoop调度框架搭建
订阅云计算RSSCSDN首页> 云计算 Java线程池管理及分布式Hadoop调度框架搭建 来源个人博客| 2 条评论| 作者Lanceyan摘要:多线程一直不是件容易的事情,然而开发过程却又经常碰到,有时甚至还会被作为考校程序员实力的一个指标。这样一来,多线程已然成为一道必须迈过的砍!【编者按】多线程是程序员面试时常常会面对的问题,对多线程转载 2014-04-16 22:38:45 · 996 阅读 · 0 评论 -
Hadoop示例程序WordCount详解及实例 .
1.图解MapReduce 2.简历过程:Input:Hello World Bye WorldHello Hadoop Bye HadoopBye Hadoop Hello HadoopMap:Sort:Combine转载 2014-04-16 22:33:10 · 1279 阅读 · 0 评论 -
Hadoop中Writable和WritableComparable区别
Hadoop的key和value的传递序列化需要涉及两个重要的接口Writable和WritableComparable1> Writable:Java代码 void write(DataOutput out) throws IOException; void readFields(DataInput in) throws IOException;转载 2014-04-16 22:10:55 · 6112 阅读 · 1 评论 -
Hadoop WritableComparable接口
WritableComparable接口Writable接口大家可能都知道,它是一个实现了序列化协议的序列化对象。在Hadoop中定义一个结构化对象都要实现Writable接口,使得该结构化对象可以序列化为字节流,字节流也可以反序列化为结构化对象。那WritableComparable接口是可序列化并且可比较的接口。MapReduce中所有的key值类型都必须实现这个接口,既然是可序列化的那就转载 2014-04-16 22:09:09 · 962 阅读 · 0 评论 -
Hadoop实战-初级部分 之 Hadoop集群的安装
第一部分:Word Count 程序讲解 •编写一个MapReduce 程序的步骤 –编写一个Mapper类 –编写一个Reducer类 –编写一个Driver类(即Job),来将Mapper与Reducer类来进行组合。 java代码:查看复制到剪贴板打印Mapper publi转载 2013-12-15 00:06:16 · 1626 阅读 · 0 评论 -
Hadoop实战-初级部分 之 Hadoop 分布式文件系统3
第一部分:数据完整性 数据完整性及其采用的技术 保证数据在传输过程中不损坏 ,常见的保证数据完整性采用的技术 A.奇偶校验技术 B.ECC校验纠错技术 C.CRC-32循环冗余校验技术 HDFS以透明方式校验所有写入它的数据,并在默认设置下,会在读取数据时验证校验和。针对数据的每个io.bytes.per.checksum(默认512字节转载 2013-12-14 23:57:48 · 954 阅读 · 0 评论 -
Hadoop实战-初级部分 之 Hadoop 分布式文件系统1
第一部分:什么是HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 HDFS是高容错性的,可以部署在低成本的硬件之上,HDFS提供高吞吐量地对应用程序数据访问,它适合大数据集的应用程序。 第二部分:HDFS架构设计 HDFS 设计目标 HDFS不适合做什么转载 2013-12-14 23:48:51 · 838 阅读 · 0 评论 -
Hadoop实战-初级部分 之 Hadoop安装部署
Hadoop实战-初级部分 之 Hadoop安装部署第一部分:开始云计算之旅第二部分:初识Hadoop第三部分:Hadoop 环境安装部署第四部分:Hadoop Shell 基本操作介绍第五部分:Hadoop 分布式文件系统1第五部分:Hadoop 分布式文件系统2第五部分:Hadoop 分布式文件系转载 2013-12-14 23:42:47 · 1038 阅读 · 0 评论 -
Hadoop实战-初级部分 之 MapReduce 开发2
第一部分:Word Count 程序讲解 •编写一个MapReduce 程序的步骤 –编写一个Mapper类 –编写一个Reducer类 –编写一个Driver类(即Job),来将Mapper与Reducer类来进行组合。 java代码:查看复制到剪贴板打印Mapper publi转载 2013-12-15 00:00:44 · 898 阅读 · 0 评论 -
Hadoop实战-初级部分 之 Hadoop 分布式文件系统2
第一部分:搭建HDFS开发环境 •导入Hadoop的Jar •建立resources文件夹,放入配置文件 第二部分:Configuration •添加配置文件 •获取配置文件属性 第三部分:FileSystem API 详解 FileSystem:该类为 HDFS文件系统的抽象类,通过它可以在 Java端操作 HDFS。转载 2013-12-14 23:56:07 · 833 阅读 · 0 评论 -
Hadoop实战-初级部分 之 MapReduce 开发1
第一部分: 什么是 MapReduce Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。 MapReduce基础出发点是很易懂。它由称为map和reduce的两部分用户程序组成,然后利用框架在计算机转载 2013-12-14 23:59:25 · 917 阅读 · 0 评论 -
hadoop 2 包结构及包功能大致介绍
一、概述hadoop2的设计细想比hadoop1进步了很多,毕竟hadoop1是几年前的东西了。软件设计的理论在这几年中发展很快,出现了很多的软件设计理论 如:领域驱动模型、事件驱动模型、状生命周期管理等,也出现了很多的开源的解决方案,当然开源的方案很多都是起源apache社区。在hadoop2中,采取了maven的工程管理结构,把以前的单一工程换成了多工程结构模式,现在估计有45个(转载 2014-05-07 22:39:26 · 897 阅读 · 0 评论