RDD默认分区源码解析(RDD数据从集合中创建)

最新推荐文章于 2022-08-17 00:00:00 发布

mischen520

最新推荐文章于 2022-08-17 00:00:00 发布

阅读量159

点赞数

分类专栏： Spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/miachen520/article/details/117683984

版权

大数据同时被 2 个专栏收录

146 篇文章 5 订阅

订阅专栏

25 篇文章 1 订阅

订阅专栏

2.2.1 默认分区源码（RDD数据从集合中创建）

1）默认分区数源码解读

上述查看源码的操作是在idea中进行的，要学会使用ctrl+h查看源码

2）创建一个包名：com.atguigu.partition

3）代码验证

package com.mischen.partition

import org.apache.spark.rdd.RDD

import org.apache.spark.{SparkConf, SparkContext}

object partition01_Array_default {

def main(args: Array[String]): Unit = {

//1.创建SparkConf并设置App名称

val conf: SparkConf = new SparkConf().setAppName("SparkCoreTest").setMaster("local[*]")

//2.创建SparkContext，该对象是提交Spark App的入口

val sc: SparkContext = new SparkContext(conf)

val rdd: RDD[Int] = sc.makeRDD(Array(1,2,3,4))

//3. 输出数据，产生了12个分区

rdd.saveAsTextFile("output")

//结论:从集合创建rdd,如果不手动写分区数量的情况下,默认分区数跟本地模式的cpu核数有关

//local : 1个 local[*] : 笔记本所有核心数 local[K]:K个

//4.关闭连接

sc.stop()

}

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RDD默认分区源码解析(RDD数据从集合中创建)

2.2.1 默认分区源码（RDD数据从集合中创建）1）默认分区数源码解读上述查看源码的操作是在idea中进行的，要学会使用ctrl+h查看源码2）创建一个包名：com.atguigu.partition3）代码验证package com.mischen.partitionimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object partition01_Arr
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。