- 博客(2)
- 收藏
- 关注
原创 MapReduce切片源码
MapReduce的splits切片逻辑源码分析 as we know!我们认知中的splits大小默认与block的大小相同! 即有几个block就会有几个splits,这样真的正确吗? 先贴上源码: 如图所示为我们编写的一个mapreduce的driver程序,参考hadoop官网。 当我们进入FileInputFormat类中,发现该类是一个一个继承自FileInput的抽象类 该类中包...
2019-09-09 15:55:58 330
原创 HDFS工作原理以及流程
1.Datanode进行上传数据流程 1.client node 向Namenode发起请求 2.Nomenode通过验证,向client node节点返回信息。 信息包含:1.同意上传文件 2.上传的文件被分成几个block 【分块的好处:1.由整化零,分块存储更加方便。 2.磁盘最少能分多少个块可以事先知道。】 【分块的大小:hadoop2上默认为128M hadoop1中默认为为64M...
2019-03-13 21:41:16 1039
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人