MapReduce
RiverM
这个作者很懒,什么都没留下…
展开
-
Hadoop MapReduce 任务执行流程源代码详细解析
目录 1 引言 1.1 目的 1.2 读者范围 2 综述 3 代码详细分析 3.1 启动Hadoop集群 3.2 JobTracker启动以及Job的初始化 3.3 TaskTracker启动以及发送Heartbeat 3.4 JobTracker接原创 2011-09-27 15:01:58 · 15496 阅读 · 4 评论 -
MapReduce模型中常用join方法小结
这篇文章是在阅读《A Comparison of Join Algorithms for Log Processing in MapReduce》后对该文的一个小结。该文章详细介绍几种在mapreduce模型下的join算法,并且对他们的性能作出系统的评测。目前像pig,hive等上层应用在进行join计算时也是利用该文中提出的算法或者算法变种。 需求: 假设有两原创 2012-04-21 21:55:06 · 2475 阅读 · 0 评论