数据倾斜的问题其实就是map端输出的数据分发到reduce端不均匀,使得在reduce端有的reducer处理的数据量过大,有的reducer处理的数据量过少,造成数据倾斜于一方。
解决方法是在map端进行——》map side join操作
代码如下:
package com.jym.hadoop.mr.mapsidejoin; import java.io.BufferedReader; |
数据倾斜的问题其实就是map端输出的数据分发到reduce端不均匀,使得在reduce端有的reducer处理的数据量过大,有的reducer处理的数据量过少,造成数据倾斜于一方。
解决方法是在map端进行——》map side join操作
代码如下:
package com.jym.hadoop.mr.mapsidejoin; import java.io.BufferedReader; |