安装原文:https://blog.csdn.net/w417950004/article/details/77203501
按照上面的安装教程碰到了一些问题,在这里总结一下:
1、下面的文件要装齐,scala、Hadoop、spark、jdk要注意对应版本。上面教程里百度云失效,我打包在了这里:
链接:https://pan.baidu.com/s/1EYWD2L5Yqrzrc7RoiPNlHg 密码:p0j6
如果没有装scala,在cmd下spark-shell将会无法启动!
2、JDK安装路径文件夹不能存在空格,否则会报错'Files\spark-2.3.1-bin-hadoop2.7\jars""\' 不是内部或外部命令,也不是可运行的程序 或批处理文件。像下面这样就存在空格了:
如果报错卸载重新安装到一个没有空格的文件夹下即可。
spark-shell
pyspark