SparkSql 控制输出文件数量且大小均匀(distribute by rand())
减少数据倾斜
distribute by rand() 使得hdfs文件切分得更加均衡
最新推荐文章于 2024-05-09 17:10:22 发布
SparkSql 控制输出文件数量且大小均匀(distribute by rand())
减少数据倾斜