【无标题】

最新推荐文章于 2024-07-09 23:01:07 发布

LYYAWZY

最新推荐文章于 2024-07-09 23:01:07 发布

阅读量228

点赞数

分类专栏： python 文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LYYAWZY/article/details/126222267

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

spark读取本地文件,hdfs文件的写法(python版本)

读取本地数据(linux本地数据)
写法为:
if name == ‘main’:
sc=SparkContext()
rdd1=sc.textFile(‘hdfs://node1:8020/data/data.txt’)
rdd2=sc.textFile(‘/input/1.txt’)
local_path=‘file:///export/data/hdfs.txt’
rdd3=sc.textFile(local_path)
print(rdd1.collect())
print(rdd2.collect())
print(rdd3.collect())
print(“pyspark模板”)
local_path='file:///export/data/hdfs.txt’指的是本地的路径
默认读取的是:
hdfs上的数据
读取本地的数据一般是以file://开头,加上以本地的数据路径

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【无标题】

spark的rdd读取本地数据和hdfs数据
复制链接

扫一扫

专栏目录

LYYAWZY CSDN认证博客专家 CSDN认证企业博客

码龄5年

12: 原创

108万+: 周排名

66万+: 总排名

8811: 访问

: 等级

197: 积分

0: 粉丝

11: 获赞

1: 评论

20: 收藏

私信

关注

热门文章

分类专栏

python 3篇
Java 2篇
命令行 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。