自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 hadoop之shuffle

http://langyu.iteye.com/blog/992916

2015-11-27 10:15:51 245

原创 hadoop之combiners编程

大数据的世界里,我们知道每一个map可能会产生大量的输出,combiner的作用就是在map端对输出先做一次合并,以减少传输到reducer的数量。combiner最基本是实现本地key的归并,combiner具有类似本地的reducer功能。     注意:combiner的输出就是reducer的输入,如果combiner是可插拔的,添加combiner决不能改变最终的计算结果,所以com

2015-11-26 15:16:19 287

原创 hadoop之partitioner编程

在写这篇文章之前,笔者已经大致的描述过关于hadoop的mapreduce的处理数据的过程。在这边,笔者主要来介绍一下在map阶段和reduce阶段之间进行的一些数据处理。在map读取并处理完数据后,会把数据发送到partitioner,由partitioner来决定每一个键值对送往那个reduce节点。默认使用HashPartitioner,其核心方法是getPartition(),具体代码

2015-11-26 14:44:38 290

原创 hadoop的mapreduce原理解析

随着大数据的不断深入,人们正从信息时代在向数据时代转型

2015-11-25 15:42:01 343

原创 关于数据结构三种简单的排序总结

大家都知道,对于数据结构有三种简单的排序:冒泡排序,选择排序和插入排序,说他们简单是因为他们在排序的速度相对较慢,而且排序的算法也比较简单,更适用于数据量小的文件排序中。下面我们就分别来分析一下这三种排序。    首先来说说冒泡排序:它是这三种排序中最简单也是最为人熟悉的一种排序,它的思想是用每一次循环来固定一个值的位置。很显然,当我们有N个值的时候,我们就需要比较N-1趟,在每一趟的确定值中

2015-11-09 23:37:33 1377

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除