Hadoop面试题
1、hadoop运行原理
(1)HDFS文件上传
(2)MapReduce
问题:Task并行经验:
最好每隔task的执行时间至少一分钟.如果job的每个map或者reduce task的运行时间都只有30-40秒钟,那么就减少该job的map或者reduce数,每一个task(map|reduce)的setup和加入到调度器中进行调度,这个中间的过程可能都要花费几秒钟,所以如果每个task...
原创
2019-01-02 22:41:47 ·
2206 阅读 ·
0 评论