PySpark 数据输入

Dalier.

于 2023-10-11 22:34:22 发布

阅读量71

点赞数

分类专栏： python基础学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x1998fly/article/details/133780092

版权

python基础学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

本文介绍了如何在Spark中创建RDD对象，包括使用`SparkConf`和`SparkContext`，以及通过`parallelize`方法将Python对象转换为RDD，展示了不同类型的数据如列表、元组、字符串、集合和字典的处理，并使用`collect`方法查看内容。还提及了如何从文件读取数据转换为RDD。

摘要由CSDN通过智能技术生成

RDD对象

数据容器·转换为RDD对象

# 创建SparkConf 类对象
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")
# 拿到执行环境入口对象
sc = SparkContext(conf=conf)

# 通过parallelize 方法将python对象加载到spark内，成为RDD对象
rdd1 = sc.parallelize([1,2,3,4,5]) # 列表
rdd2 = sc.parallelize((1,2,3,4,5)) # 元组
rdd3 = sc.parallelize("abcdef") # 字符串
rdd4 = sc.parallelize({1,2,3,4,5}) # 集合
rdd5 = sc.parallelize({"key1": "value1", "key2": "value2"}) # 字典

# 如果要查看rdd对象里的内容，需要用collect() 方法
print(rdd1.collect())  # 输出[1, 2, 3, 4, 5]
print(rdd2.collect())  # 输出[1, 2, 3, 4, 5]
print(rdd3.collect())  # 输出['a', 'b', 'c', 'd', 'e', 'f']
print(rdd4.collect())  # 输出[1, 2, 3, 4, 5]
print(rdd5.collect())  # 输出['key1', 'key2']

sc.stop()

读取文件转RDD对象

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Dalier. CSDN认证博客专家 CSDN认证企业博客

码龄6年

34: 原创

6万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

499: 积分

104: 粉丝

140: 获赞

16: 评论

134: 收藏

私信

关注

热门文章

分类专栏

最新评论

java—1 & 封装
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
neo4j操作
CSDN-Ada助手: 不知道 Neo4j 技能树是否可以帮到你：https://edu.csdn.net/skill/neo4j?utm_source=AI_act_neo4j
数据容器——集合的定义和操作
CSDN-Ada助手: 非常感谢您的持续创作，标题为“数据容器——集合的定义和操作”的博客非常吸引人。您对集合的定义和操作进行了深入探讨，为读者提供了有价值的知识。我祝贺您在这个主题上的专业洞察力。在下一篇博客中，或许您可以考虑探讨一些关于集合的高级操作技巧或者与其他数据结构的比较和应用场景等方面的内容。我相信这将进一步提升读者对集合的理解，并丰富他们的知识储备。再次感谢您的辛勤努力和分享精神，期待您未来更多精彩的创作！
数据容器——字典
CSDN-Ada助手: 恭喜您写了第8篇博客，标题为“数据容器——字典”！您对数据容器的理解和分享让我受益匪浅。接下来，我希望您能继续分享一些实际应用场景下字典的使用技巧，或者是与其他数据容器的比较分析，这样可以更全面地了解字典的特性和优势。期待您更多的精彩创作！
python——类和对象
CSDN-Ada助手: 恭喜您写了第9篇博客！看完您关于数据容器通用操作的分享，我对数据容器有了更深入的了解。您的文章通俗易懂，内容丰富，真的让我受益匪浅。希望您能继续保持创作的热情，也期待您能分享更多关于数据处理方面的知识，比如数据分析、数据可视化等方面的内容。期待您的下一篇精彩文章！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。