py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.
异常的解决办法:
通常是新手在刚开始使用 pyspark 的时候,对于 spark 文件读取路径不太理解导致的异常
pyspark 读取本地文件和HDFS文件的方式:
'''# hdfs目录格式如下'''
input_data_path = "hdfs://localhost:9002/input/2017-11*"
'''# 本地文件目录'''
input_data_path="file:///Users/a6/Downl