spark读取文件注意事项

  1. local模式下默认就是读取本地文件,在standlone或者yarn-client,或者cluster模式下默认读的都是hdfs文件系统

local: 文件路径写法:

1.  linux 上写法
var localPath= sc.textFile("file:///usr/test_file/test.json")
//  读取本地本地系统文件 需要注意 文件路径必须是全路径
//  所有的集群节点上相同的path下上传该文件
2.windows 上写法
var windowsLocalPath= sc.textFile("file:///E:/usr/test_file/test.json")

非local模式: 默认读取的是hdfs 文件

var localPath= sc.textFile("/usr/test_file/test.json")
等价于
sc.textFile(“hdfs://host:8020/user/hdfs/input/test.json”)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值