Spark中，文本文件的读取和存储

小小林代码

于 2024-05-03 13:44:28 发布

阅读量271

点赞数 2

文章标签： linux hadoop spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77721393/article/details/138414863

版权

本文详细介绍了如何在Spark环境中读取本地文件hello_spaek.txt，创建RDD，设置分区并将其保存为文本文件，最后验证保存成功的步骤。

摘要由CSDN通过智能技术生成

Spark中，文本文件的读取和存储

第一步：进入到你要读取文件的路径目录下，查看是否有你要读取保存的文件

第二步：查询后发现没有你要读取的文件，就上传将要读取的文件，上传后再次查看是否有文件

上传文件，命令，rz

查看文件，命令，ll或ls

第三步：打印当前所在路径的地址，命令，pwd

第四步：进入pyspark交互式环境，命令，pyspark

第五步：读取本地文件hello_spaek.txt创建名为csdn的RDD

第六步：输出RDD元素

命令，结果如下图所示

第七步：设置分区为1，并将读取的RDD保存为文本文件，保存文本文件地址可以自己选定

第八步：重新打开个终端查看是否保存成功，如果出现_SUCCESS文件则说明保存成功

进入保存文本文件的文件下，使用ll命令查看

命令，结果如下图所示

小小林代码

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
Spark中，文本文件的读取和存储

第二步：查询后发现没有你要读取的文件，就上传将要读取的文件，上传后再次查看是否有文件。第六步：设置分区为1，并将读取的RDD保存为文本文件，保存文本文件地址可以自己选定。第七步：重新打开个终端查看是否保存成功，如果出现_SUCCESS文件则说明保存成功。第四步：读取本地文件hello_spaek.txt创建名为csdn的RDD。第一步：进入到你要读取文件的路径目录下，查看是否有你要读取保存的文件。第四步：进入pyspark交互式环境，命令，进入保存文本文件的文件下，使用ll命令查看。命令，结果如下图所示。
复制链接

扫一扫

小小林代码 CSDN认证博客专家 CSDN认证企业博客

码龄1年

19: 原创

133万+: 周排名

8万+: 总排名

2万+: 访问

: 等级

231: 积分

29: 粉丝

36: 获赞

19: 评论

48: 收藏

私信

关注

热门文章

最新评论

在运行hadoop jar时出现：Error:java.lag.ArrayIndexOutOfBoundsException错误时解决方法
CSDN-Ada助手: 恭喜您写了第18篇博客！解决了在运行hadoop jar时出现的Error:java.lag.ArrayIndexOutOfBoundsException错误，这篇博客一定帮助了很多遇到类似问题的人。不过，希望您在未来的创作中可以继续分享更多关于hadoop和其他技术方面的经验和解决方法，让更多人受益。加油！期待您的下一篇作品。
在运行hadoop jar时出现：Error:java.lag.ArrayIndexOutOfBoundsException错误时解决方法
CSDN-Ada助手: 恭喜您在第18篇博客中分享了解决运行hadoop jar时出现Error:java.lag.ArrayIndexOutOfBoundsException错误的方法！这样的经验分享对于其他使用者来说无疑是非常有用的。希望您能继续坚持创作，分享更多有价值的内容。或许下一步可以考虑分享一些实际案例或者深入的技术分析，让读者能够更全面地了解相关知识。期待您的下一篇作品！
Spark中，文本文件的读取和存储
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark中，文本文件的读取和存储
普通网友: 博主的文章让我对这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark中，文本文件的读取和存储
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。