自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小于号的专栏

技术改变生活

  • 博客(3)
  • 资源 (5)
  • 收藏
  • 关注

原创 多数据源的MapReduce作业(三)--map侧过滤后在reduce侧联结

在某些情况下,SemiJoin抽取出来的小表的key集合在内存中仍然存放不下,这时候可以使用BloomFiler以节省空间。BloomFilter最常见的作用是:判断某个元素是否在一个集合里面。它最重要的两个方法是:add() 和contains()。最大的特点是不会存在false negative,即:如果contains()返回false,则该元素一定不在集合中,但会存在一定的true n

2013-04-08 01:13:38 3284 1

原创 多数据源的MapReduce作业(二)--基于Distributed的复制联结

多数据源在reduce侧做join操作,效率不会太高。我们首先会让所有的数据在网络上重排,然后在conbine联结过程中丢弃了大部分的数据。如果我们在mapper侧就去除不必要的数据,联结会更有效率。  map阶段执行联结主要障碍是一个mapper正在处理的记录要能访问到另外表的所有数据,这样就能保证map侧联结可以正常工作。   引入hadoop的DistributedCache。仔细观

2013-04-06 14:49:51 1507

原创 多数据源的MapReduce作业(一)--Reduce侧的联结

场景:实现多表的join操作。select   customers.*,orders.* from customersjoin orderson customers.id =orders.id使用DataJoin软件包进行实现联结操作。扩展三个类:1、DataJoinMapperBase2、DataJoinReducerB

2013-04-04 16:02:52 3202

java实例教程,从0开始学

java实例教程,从0开始学java,坚持看完对java的学习很有帮助

2010-07-23

3Dmax实例教程全集下载05

本教程是争对了解了3Dmax或其他相关3D动画软件的人的进一步学习所整理的,本教程分好几部分(总共8部分,01~08),因为网站只允许上传小于15M的大小资源,所以没办法只能拆开上传了,大家谅解!

2010-07-19

3Dmax实例教程全集下载04

本教程是争对了解了3Dmax或其他相关3D动画软件的人的进一步学习所整理的,本教程分好几部分(总共8部分,01~08),因为网站只允许上传小于15M的大小资源,所以没办法只能拆开上传了,大家谅解!

2010-07-19

3Dmax实例教程全集下载03

本教程是争对了解了3Dmax或其他相关3D动画软件的人的进一步学习所整理的,本教程分好几部分(总共8部分,01~08),因为网站只允许上传小于15M的大小资源,所以没办法只能拆开上传了,大家谅解!

2010-07-19

杭电算法PPT详解以及各类算法精炼

包含中级算法,配套各类习题讲解,简单易懂!

2010-07-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除