- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 Hadoop实战(五) 高阶MapReduce
本章重点概括 TODO链接MapReduce作业顺序链接这种任务可以手动的逐个执行,但生成自动化执行序列的方式更为便捷。 mapreduce-1 | mapreduce-2 | mapreduce-3 | … 具复杂依赖的作业链接(非线性链接)通过Job和JobControl类来管理依赖JobControl类负责管理并监控作业的执行JobControl对象使用addJob()方法向其中
2017-02-28 11:08:49 557
原创 Hadoop2.2.0源码系列--Job类
获取Job对象Job的构造函数最直接的获取Job对象的方式@Deprecated public Job() throws IOException { this(new Configuration()); } @Deprecated public Job(Configuration conf) throws IOException { this(new JobConf(c
2017-02-28 10:18:50 1080
原创 Hadoop实战(四) 编写MR程序
Hadoop实战(四) 编写MR程序样例数据集1. 下载数据集Address: http://www.nber.org/patents/ wget http://www.nber.org/patents/acite75_99.zip wget wget http://www.nber.org/patents/apat63_99.zip解压: unzip acite75_99.zip上传
2017-02-28 09:17:42 3816
原创 leetcode73_ Set Matrix Zeroes
问题描述Given a m x n matrix, if an element is 0, set its entire row and column to 0. Do it in place.代码编写*很明显是遍历的思想,但是做不到一遍做完所有,至少要两遍。 *于是想到先遍历行,再遍历列。为节省时间,在遍历列的时候,需要置零的列就不再考虑已经被置零的行。 *我的思路问题就在于只考虑了优化时间复
2017-02-27 20:37:22 491
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人