使用IDEA进行spark读取HDFS上的文件遇到的两个错误:
(1)Failed on local exception: java.io.IOException: 你的主机中的软件中止了一个已建立的连接
我是连接xshell开启集群再在IDEA读取hdfs上的数据:
val data = spark.read.option("header","true").option("delimiter",",").csv("hdfs://master:50070/usr/root/test.csv")
后面发现中午吃饭的时候将电脑睡眠了,再来打开电脑,其实xshell那边断开了连接,所以在xshell那边重新连接上就好了。
(2)读取数据目录时报错
21/04/05 13:56:49 WARN FileStreamSink: Error while looking for metadata directory.
Exception in thread "main" java.io.IOException: Failed on local exception: com.google.protobuf.InvalidProtocolBufferException: Protocol message end-group tag did not match expected tag.; Host Deta