MapTask原理分析
MapReduce原理分析文章目录MapReduce原理分析一、MapTask运行机制详解二、MapTask的并行度切片机制源码阅读一、MapTask运行机制详解MapTask流程详细步骤:首先,读取数据组件InputFormat(默认TextInputFormat)会通过getSplits方法对输入目录中文件进行逻辑切片规划得到splits,有多少个split就对应启动多少个MapTask。split与block的对应关系默认是一对一。将输入文件切分为splits之后,由Recor
复制链接