hadoop
文章平均质量分 88
左VJ
其实,工作也挺有趣的。
展开
-
Hadoop进阶之MR中MapTask并行度决定机制及切片机制
前言mapTask并行度的决定机制FileInputFormat切片机制切片定义在InputFormat类中的getSplit方法FileInputFormat中默认的切片机制FileInputFormat中切片的大小的参数配置map并行度的经验之谈ReduceTask并行度的决定前言maptask的并行度决定map阶段的任务处理并发度,进而影响到整个j原创 2018-01-15 17:51:31 · 3053 阅读 · 0 评论 -
Hadoop进阶之MapReduce编程模型简介和总结
本文转载修改自《MapReduce编程模型简介和总结》 https://www.cnblogs.com/mmaa/p/5789911.htmlInputFormatOutputFormatMapper和ReducerPartitionerMapReduce应用广泛的原因之一就是其易用性,提供了一个高度抽象化而变得非常简单的编程模型,它是在总结大量应用的共同特点的基础转载 2018-01-16 11:20:17 · 3939 阅读 · 0 评论 -
Hadoop进阶之读写文件内部工作机制
转载修改自《Hadoop读写文件时内部工作机制》 https://www.cnblogs.com/beanmoon/archive/2012/12/17/2821548.html读文件Hadoop中的网络拓扑写文件replica是如何分布的读文件读文件时内部工作机制参看下图 具体流程 1. 客户端通过调用FileSystem对象(对应于HD转载 2018-01-15 10:16:25 · 1483 阅读 · 0 评论