SparkR遇到的问题之找不到路径

最新推荐文章于 2023-11-12 20:52:49 发布

young_so_nice

最新推荐文章于 2023-11-12 20:52:49 发布

阅读量1.7k

点赞数

分类专栏： SparkR问题文章标签：问题

本文链接：https://blog.csdn.net/young_so_nice/article/details/52161470

版权

SparkR问题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一次在sparkR运行单词计数，遇到到下面问题。

16/08/09 11:42:07 ERROR RBackendHandler: collect on 40 failed
Error in invokeJava(isStatic = FALSE, objId$id, methodName, ...) : 
  org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: hdfs://nameservice1/user/root/user/yjl/aa.txt
        at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:285)
        at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)
        at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:313)
        at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:207)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
	        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd.RDD.partitions(RDD.scala:237)
        at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:239)
	        at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:237)
        at scala.Option.getOrElse(Option.scala:120)
        at org.apache.spark.rdd

程序默认是在hdfs的root路径下找文件的，这里是因为，没有指定好路径，所以文件找不到，正确的是：
lines <- SparkR:::textFile(sc,"/user/yjl/aa.txt")用"file///home/aa.txt"在集群本地找也是找不到的。

young_so_nice

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SparkR遇到的问题之找不到路径

第一次在sparkR运行单词计数，遇到到下面问题。16/08/09 11:42:07 ERROR RBackendHandler: collect on 40 failedError in invokeJava(isStatic = FALSE, objId$id, methodName, ...) : org.apache.hadoop.mapred.InvalidInputExcepti
复制链接

扫一扫