文章目录 一、Spark集群拓扑 二、做好准备工作 (一)准备本地系统文件 (二)准备HDFS系统文件 (三)启动HDFS服务 三、以--master=local[*]方式启动spark-shell (一)尝试读取本地系统文件和HDFS系统上的文件 1、读取本地系统`/home/test.txt`文件创建RDD,不加`file://` 2、读取本地系统`/home/test.txt`文件创建RDD,加上`file://` 3、读取HDFS系统上的文件`/park/test.txt`,不加`hdfs://master:9000` 4、读取HDFS系统上的文件`/park/test.txt`,加上`hdfs://master:9000` (二)根据上述尝试得到结论 四、以--master=spark://master:7077方式启动spark-shell (一)尝试读取本地系统文件和HDFS系统上的文件 1、读取本地系统`/home/test.txt`文件创建RDD,不加`file://` 2、读取本地系统`/home/test.txt`文件创建RDD,加上`file://` 3、读取HDFS系统上的文件`/park/test.txt`,不加`hdfs://master:9000` 4、读取HDFS系统上的文件`/park/test.txt`,加上`hdfs://master:9000` (二)根据上述尝试得出结论 五、小结 一、Spark集群拓扑 二、做好准备工作 (一)准备本地系统文件 在/home目录里创建test.txt (二)准备HDFS系统文件 将test.txt上传到HDFS系统的/park目录里