Spark——RDD创建详解

最新推荐文章于 2021-03-08 12:01:14 发布

码农Academy

最新推荐文章于 2021-03-08 12:01:14 发布

阅读量733

点赞数 1

分类专栏： spark 文章标签： spark rdd创建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhaojw_420/article/details/53261799

版权

spark 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、RDD创建的两种方式
1、外部数据源
Scala：

val file = sc.textFile("hdfs://hadoop:8020/words.txt",partitions )//partitions分区参数，不写，是默认的分区个数，可手动指定

Java：

JavaRDD<String> lines = sc.textFile("hdfs://hadoop:8020/words.txt");

2、驱动程序里分发驱动器程序中的对象集合（比如list或者set或者Array）
Scala：

val data = Array(1, 2, 3, 4, 5)
val distData = sc.parallelize(data,partitions )//partitions分区参数，不写，是默认的分区个数，可手动指定
等价于：
val file=sc.parallelize(List(1,2,34,5))

Java：

List<Integer> data = Arrays.asList(1, 2, 3, 4, 5);
JavaRDD<Integer> distData = sc.parallelize(data);

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark——RDD创建详解

一、RDD创建的两种方式 1、外部数据源 Scala：val file = sc.textFile("hdfs://hadoop:8020/words.txt",partitions )//partitions分区参数，不写，是默认的分区个数，可手动指定Java：JavaRDD<String> lines = sc.textFile("hdfs://hadoop:8020/words.txt")
复制链接

扫一扫

专栏目录

码农Academy CSDN认证博客专家 CSDN认证企业博客

码龄9年

112: 原创

8万+: 周排名

2万+: 总排名

45万+: 访问

: 等级

4894: 积分

757: 粉丝

968: 获赞

43: 评论

1260: 收藏

私信

关注

热门文章

分类专栏

SpringBoot 1篇
linux 6篇
hadoop 7篇
java 33篇
前端
XML 7篇
spark 10篇
webservice 3篇
数据结构与算法 7篇
MySql 3篇
Redis 7篇
J2EE高并发 3篇
面试 4篇

最新评论

推荐几款IDEA插件，助你玩转Mybatis开发
Jack_Chai: MyBatisX每年都有在维护啊
面试官：Mysql中EXISTS与IN的使用有哪些差异
二十四桥_: 大佬，“IN大表，EXISTS大表”这个案例中的主查询应该是1万行吧？？？
面试官：Mysql中EXISTS与IN的使用有哪些差异
绝活敌法师: 但由于其是根据主查询的每一条customer_no逐个检查是否存在匹配项，因此当遇到第一条不满足条件的customer_no时，就可以立即停止对子查询中剩余行的处理。这里‘不满足’是不是应该是‘满足’
美团一面：什么是CAS？有什么优缺点？我说你说的是AtomicInteger吗？
Kwan的解忧杂货铺@新空间代码工作室: 博主的文章总是如一泓清泉，让我心旷神怡，希望你继续为读者奉献智慧的涵泳。每篇博客都如一本启发书，我从中汲取灵感，希望博主继续为我们献上这些珍宝。你的文章总是充满了深度和洞见，让我对这个领域有更深刻的理解。
美团二面：SpringBoot读取配置优先级顺序是什么？
征途黯然.: This article provides a lot of information about 美团二面SpringBoot读取配置优先级顺序是什么 and offers a more comprehensive understanding.

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。