课记
Dont_let_me_down
这个作者很懒,什么都没留下…
展开
-
HDFS工作原理以及流程
1.Datanode进行上传数据流程1.client node 向Namenode发起请求2.Nomenode通过验证,向client node节点返回信息。信息包含:1.同意上传文件 2.上传的文件被分成几个block【分块的好处:1.由整化零,分块存储更加方便。2.磁盘最少能分多少个块可以事先知道。】【分块的大小:hadoop2上默认为128M hadoop1中默认为为64M...原创 2019-03-13 21:41:16 · 1043 阅读 · 0 评论 -
MapReduce切片源码
MapReduce的splits切片逻辑源码分析as we know!我们认知中的splits大小默认与block的大小相同!即有几个block就会有几个splits,这样真的正确吗?先贴上源码:如图所示为我们编写的一个mapreduce的driver程序,参考hadoop官网。当我们进入FileInputFormat类中,发现该类是一个一个继承自FileInput的抽象类该类中包...原创 2019-09-09 15:55:58 · 331 阅读 · 0 评论