自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (24)
  • 问答 (1)
  • 收藏
  • 关注

原创 MapReduce工作原理

Map-Reduce框架的运作完全基于对,即数据的输入是一批对,生成的结果也是一批对,只是有时候它们的类型不一样而已。Key和value的类由于需要支持被序列化(serialize)操作,所以它们必须要实现Writable接口,而且key的类还必须实现WritableComparable接口,使得可以让框架对数据集的执行排序操作。一个Map-Reduce任务的执行过程以及数据输入输出的类型...

2010-06-30 13:45:25 133

原创 Hadoop开发常用的InputFormat和OutputFormat

Hadoop中的Map Reduce框架依赖InputFormat提供数据,依赖OutputFormat输出数据;每一个Map Reduce程序都离不开他们。Hadoop提供了一系列InputFormat和OutputFormat方便开发,本文介绍几种常用的。TextInputFormat用于读取纯文本文件,文件被分为一系列以LF或者CR结束的行,key是每一行的位置(偏移量,Long...

2010-06-30 13:39:55 243

原创 Eclipse下hadoop插件的配置

1、首先打开/hadoop-0.19.0/contrib/ 会发现有一个eclipse-plugin【简称EP】.这个插件就和IBM所说的插件是一样的。现在我们开始下一步的配置吧。2、直接把EP放到eclipse/plugins下。然后重启eclipse.现在你会发现 window/show-view 多了一个一项(MapReduce Tools),这个正是我们所需要的。3、找到MapRe...

2010-06-29 14:16:47 115

原创 Mapper和Reducer的分析

1.reduce和map类似,每个task内部可以共享静态类属性,每个task可能会多次调用reduce()函数,但每个key只对应某节点上的某个task的reduce()函数的一次执行2.多个tasks之间不能共享静态类属性,即使在同一台机器上,因为是以进程方式运行3.一个key不可能被两个tasks拆分执行,不管是否在相同的节点上。4. Hadoop Map/Reduc...

2010-06-29 10:46:37 778

原创 MapReduce的存在

MapReduce是 Google的一项重要技术,它是一个编程模型,用以进行大数据量的计算。对于大数据量的计算,通常采用的处理手法就是并行计算。至少现阶段而言,对许多开发人员来说,并行计算还是一个比较遥远的东西。MapReduce就是一种简化并行计算的编程模型,它让那些没有多少并行计算经验的开发人员也可以开发并行应用。在我看来,这也就是MapReduce的价值所在,通过简化编程模型,降低了开发并行...

2010-06-29 09:47:57 95

原创 namenode与secondaryNamenode的联系

NameNode将对文件系统的改动追加保存到本地文件系统上的一个日志文件(edits)。当一个NameNode启动时,它首先从一个映像文件(fsimage)中读取HDFS的状态,接着应用日志文件中的edits操作。然后它将新的HDFS状态写入(fsimage)中,并使用一个空的 edits文件开始正常操作。因为NameNode只有在启动阶段才合并fsimage和edits,所以一段时间后日志文件可...

2010-06-28 10:09:59 206

原创 理解java中的反射机制

一、反射的概念 :反射的概念是由Smith在1982年首次提出的,主要是指程序可以访问、检测和修改它本身状态或行为的一种能力。这一概念的提出很快引发了计算机科学领域关于应用反射性的研究。它首先被程序语言的设计领域所采用,并在Lisp和面向对象方面取得了成绩。其中LEAD/LEAD++ 、 OpenC++ 、MetaXa和OpenJava等就是基于反射机制的语言。最近,反射机制也被应用到了视...

2010-06-28 09:14:55 83

原创 过了一个月又回来了

呵呵!感谢大家还这么的支持我,时间过的好快啊,过了一个月我又回来了。希望以后还和大家一起把自己好的文章分享给大伙!加油!

2010-06-20 15:51:16 86

apache-flink

详细讲解了flink基础内容,并且从实际列子出发,一步一步讲解

2018-03-21

hadoop部署与集群运维

里面讲了一些hadoo是如何部署与运维的知识点,希望对初学者有所帮助!

2018-02-02

学习scala好的项目

该scala项目时自己整理的,对初学者很有帮助,里面包含了scala各种技术

2018-02-02

spark培训ppt

自己写的spark ppt ,给公司内部员工培训使用

2014-10-31

php中文手册

php官方中文手册,php程序员手边不可缺少的宝贝!

2012-01-10

python企业面试题

python面试题,详细介绍了一般企业的面试题。够用了

2011-09-28

hadoop作业调优参数整理及原理

hadoop作业调优参数整理及原理,并且针对部分的原理和视图详细说明

2011-08-07

提高hadoop的mapreduce job效率笔记

修改mapper和reducer数量,如何使用combiner,什么时候该选择哪个writeable等。资料里很详细说明了。

2011-08-07

linux下如何配置分布式检索

这个是自己在工作当中总结的,配置分布式检索的文档。比较实用的。

2011-05-15

Eclipse tomcat插件

很实用的eclipse Tomcat插件

2011-04-24

heritrix 的详细配置 与 使用资料

heritrix 的详细配置 与 使用资料.里面对heritrix配置有详细的说明!

2010-12-29

hadoop学习笔记,总结性的!

hadoop学习笔记,总结性的!里面有平时自己在工作过程当中总结的。也有从网络上下载的。

2010-12-29

HBASE官方文档以及注解

从官方翻译过来的资料,内容比较全面哦!希望对各位兄弟有用!

2010-12-28

hbase介绍以及详细讲解

里面对HBASE进行了详细的讲解,希望对各位有用

2010-12-28

CSS 层叠样式表手册 v1.10.exe

css基本手册,里面的内容很详细,是软件开发工程师和界面设计师的必备手册

2009-02-24

ActionScript3.0中文版.chm

flex学习的必备手册,随时的查阅!详细的介绍了flex的一些基本的控件

2009-02-24

EXT 中文手册.pdf

重点介绍了ext的详细内容,从简单的列子到复杂的例子都有详细的说明。

2009-02-24

树形菜单 -- 如何调用dtree里的函数来写树形菜单

如何调用dtree里的函数来写树形菜单,最近自己也在写树形菜单,发现这个dtree挺好,推荐下大家如果项目当中使用了树形菜单的话,那么这个就是其中的一个选择。

2008-11-28

ajaxUpload示例

介绍了ajax的用法和示例

2007-09-12

DWR.jar

DWR所用的jar,供大家参考

2007-04-29

ibatis

很好的学习ibatis资料!

2007-04-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除