对于Spark RDD加载的文件,可以分为几类:
首先加载本地文件,加载方式:
val localFileRDD = sc.textFile("file://usr/wordcount.txt")
其次加载hdfs文件,加载方式:
val textHDFSFile = sc.textFile("/user/README.md")
或者:
val textHDFSFile1 = sc.textFile("hdfs://user/README.md")
对于Spark RDD加载的文件,可以分为几类:
首先加载本地文件,加载方式:
val localFileRDD = sc.textFile("file://usr/wordcount.txt")
val textHDFSFile = sc.textFile("/user/README.md")
或者:
val textHDFSFile1 = sc.textFile("hdfs://user/README.md")