
源码




文件输出流缓冲区大小(游泳池放水的水管子流速)

开始写,要攒够条数,才能flush一次磁盘



结论
这三个参数,只有spark.shuffle.file.buffer是可以加大的,相当于增大排水管流量。
实验
优化前
代码

结果



优化后
代码

结果



对比

哇~游泳池排空大大提速了!!





文件输出流缓冲区大小(游泳池放水的水管子流速)

开始写,要攒够条数,才能flush一次磁盘



这三个参数,只有spark.shuffle.file.buffer是可以加大的,相当于增大排水管流量。









哇~游泳池排空大大提速了!!
1010

被折叠的 条评论
为什么被折叠?