Spark将dataframe存为csv文件

最新推荐文章于 2025-03-18 10:51:10 发布

楓尘林间

最新推荐文章于 2025-03-18 10:51:10 发布

阅读量2.4w

点赞数 14

分类专栏： Scala Spark Linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bowenlaw/article/details/102664945

版权

楓尘君一直觉得将df存为csv文件是一个非常简单操作处理，但是当查阅资料之后发现网上有很多误导和错误，本着从实际出发的原则，记录一下过程：

1. 发现问题

背景：楓尘君想利用spark处理较大的数据集，然后用python将提取特征后的数据集建模

用spark将数据筛选后生成dataframe类型的表： data
于是从网上查看了一下将data表转化为csv文件的方法，于是我发现：

在这里插入图片描述来自：http://cn.voidcc.com/question/p-wygpwrof-boe.html
来自：https://ask.helplib.com/csv/post_12540297

在这里插入图片描述来自：https://codeday.me/bug/20181226/467736.html

这是我google “spark dateframe存为csv” 的前三条答案
发现问题了吗？
***csv()方法里是否需要在末尾加入.csv***三条回答有两种不同的答案，想要探求问题本质的本君去查阅了一下源码

最低0.47元/天解锁文章

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。