关于spark安装的方法这里不再赘述,说说我在安装过程中的问题及解决办法吧:
首先,正常情况下,我们安装完成后,在命令行下输入 pyspark,会出现如下的内容:
那么,就证明我们的安装是成功的。
问题一: jdk版本过高的问题:
问题描述: 那么有这样的一种问题,我们运行pysaprk,虽然不会出现spark这样的图形,但也能进入到>>> 这样的环境中,但是实际spark的语句是不能执行成功的。
出现原因: 原因就是jdk版本过高的问题
解决办法:降低安装的jdk的版本,记住 spark2.x版本可以搭配的最高的jdk版本为jdk1.8 所以一定要注意这个问题,我就是因为之前安装了jdk1.9,导致出现了这样的问题,拖了我好几天,最后才发现是jdk问题。
希望我的分享能够让大家在spark配置中,少走弯路,一起加油啦~