用textfile读取文件夹所有文件提示数组越界

最新推荐文章于 2022-03-11 23:01:27 发布

zkhong07

最新推荐文章于 2022-03-11 23:01:27 发布

阅读量666

点赞数

分类专栏： Spark错误

Spark错误专栏收录该内容

2 篇文章 0 订阅

订阅专栏

java.lang.ArrayIndexOutOfBoundsException: 3
	at CountTime$$anonfun$1.apply(CountTime.scala:13)
	at CountTime$$anonfun$1.apply(CountTime.scala:11)

看别人写的这个可以读取文件夹所有文件，自己读取却提示数组越界。

val mbt=sc.textFile("/home/hadoop/Data/ ", 2).map(）

改为

val mbt=sc.textFile("/home/hadoop/Data/*.log", 2)

可以读取所有文件

 本地文件读取
val local_file_1 = sc.textFile("/home/hadoop/sp.txt")
val local_file_2 = sc.textFile("file://home/hadoop/sp.txt")
 
 当前目录下的文件
val file1 = sc.textFile("sp.txt")
 
 HDFS文件
val hdfs_file1 = sc.textFile("hdfs://192.168.146.100:9000/data/input/123.txt")
 
 多文件读取
val file2 = sc.textFile("sp.txt,a.txt,b.txt")
 
 全目录读取
val hdfs_file2 = sc.textFile("hdfs://192.168.146.100:9000//data/input/")
 
 通配符匹配
val file2 = sc.textFile("file://home/hadoop/*.txt")
 
 读取压缩文件
val file3 = sc.textFile("file://home/hadoop/sp.gz")

参考
https://www.cnblogs.com/RHadoop-Hive/p/10064599.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zkhong07

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用textfile读取文件夹所有文件提示数组越界

java.lang.ArrayIndexOutOfBoundsException: 3 at CountTime$$anonfun$1.apply(CountTime.scala:13) at CountTime$$anonfun$1.apply(CountTime.scala:11)看别人写的这个可以读取文件夹所有文件，自己读取却提示数组越界。val mbt=sc.textFile("...
复制链接

扫一扫