# Spark makeRDD默认分区策略

本文探讨了Spark的makeRDD方法默认的分区策略。通过指定参数,当length为4,numSlices为3时,数据会被如何均匀划分,如(0, 1), (1, 2), (2, 4),解释了这种分区方式的原因。" 103606141,7407027,Linux环境下MySQL安装与配置指南,"['Linux', '数据库', 'MySQL', '服务器管理', '数据库部署']
摘要由CSDN通过智能技术生成

指定参数

sc.makeRDD(List[Int](1, 2, 3, 4), numSlices = 3)

得到结果
[1], [2], [3,4]

为什么会这样分呢?

//到对应的方法中
def parallelize[T: ClassTag](
      seq: Seq[T],
      numSlices: Int = defaultParallelism)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值