自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 问答 (2)
  • 收藏
  • 关注

原创 hadoop:分布式缓存

一、 实验目的 1. 理解序列化与反序列化; 2. 熟悉 Configuration 类; 3. 学会使用 Configuration 类进行参数传递; 4. 学会在 Map 或 Reduce 阶段引用 Configuration 传来的参数; 5. 理解分布式缓存“加载小表、扫描大表”的处理思想。二、 实验要求 假定现有一个大为 100G 的大表 big.txt 和一个大小为 1M 的小表 s...

2019-11-30 20:22:41 221

原创 hadoop:join操作

一、 实验目的 1. 基于 MapReduce 思想,编写两文件 Join 操作的程序。二、 实验要求 1. 能够理解 MapReduce 编程思想,然后会编写 MapReduce 版本 Join 程序,并能执 行该程序和分析执行过程。三、 实验背景 1. 概述 对于 RDBMS 中的 Join 操作大伙一定非常熟悉,写 SQL 的时候要十分注意细节,稍 有差池就会耗时巨久造成很大的性能瓶颈,...

2019-11-30 20:05:52 361 1

原创 hadoop:二次排序

一、 实验目的 1. 进一步立即 MapReduce 思想 2. 编写 SecondarySort 程序。二、 实验要求 1. 要能理解 MapReduce 编程思想 2. 会编写 MapReduce 版本二次排序程序 3. 其执行并分析执行过程。三、 实验原理 MR 默认会对键进行排序,然而有的时候我们也有对值进行排序的需求。满足这种 需求一是可以在 reduce 阶段排序收集过来的 val...

2019-11-30 19:48:33 293

原创 hadoop计数器

hadoop计数器计数器是用来记录job的执行进度和状态的。它的作用可以理解为日志。我们可以在程序的某个位置插入计数器,记录数据或者进度的变化情况。自定义Java计数器1)MapReduce框架允许用户自定义计数器2)计数器是一个全局变量3)计数器有组的概念,可以用Java的枚举类型或者用字符串来定义#java完整代码package mr;import java.io.IOExc...

2019-11-26 22:10:51 376

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除