文章标题 spark读取文件过程中发现的问题解决记录

spark读取本地文件的方式是给路径加上file://,例如sc.textFile(“/opt/software/spark1.4/README.md”),我发现一个问题就是,我的spark软件安装在/opt/software下,我读取/opt/software目录下的文件不报错,可以正常读取,但是我想把spark机器学习这本书上的例子做一下,于是我下载了MovieLens的数据集,并且把它放在/home/hadoop/downloads/ml-100k/ml-100k下,我调用val rswData=sc.textFile(“file:///home/hadoop/downloads/ml-100k/ml-100k/u.data”),发现出错了。报错如下:

scala> val rswData=sc.textFile(“file:///home/hadoop/downloads/ml-100k/ml-100k/u.data”)
rswData: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[3] at textFile at :21

scala> rswData.first()
16/10/27 02:54:22 WARN TaskSetManager: Lost task 0.0 in stage 1.0 (TID 4, 192.168.1.112): java.io.FileNotFoundException: File file:/home/hadoop/downloads/ml-100k/ml-100k/u.data does not exist
at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:534)
at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:747)
at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:524)
at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:409)
at org.apache.hadoop.fs.ChecksumFileSystem ChecksumFSInputChecker.(ChecksumFileSystem.java:140)atorg.apache.hadoop.fs.ChecksumFileSystem.open(ChecksumFileSystem.java:341)atorg.apache.hadoop.fs.FileSystem.open(FileSystem.java:766)atorg.apache.hadoop.mapred.LineRecordReader.(LineRecordReader.java:108)atorg.apache.hadoop.mapred.TextInputFormat.getRecordReader(TextInputFormat.java:67)atorg.apache.spark.rdd.HadoopRDD anon 1.(HadoopRDD.scala:239)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:216)
at org.apache.spark.rdd.HadoopRDD.compute(HadoopRDD.scala:101)
at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:277)

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值