首先,spark,hadoop,java的相关部署在这不作详细说明
1、报错:PyCharm运行demo文件时报错:py4j.protocol.Py4JError: org.apache.spark.api.python.PythonUtils.getPythonAuthSocketTimeout does not exist in the JVM
解决方案:import pyspark之前插入这两句代码:
import findspark
findspark.init()
2、报错:使用jdbc链接数据库时报错:py4j.protocol.Py4JJavaError: An error occurred while calling o35.jdbc.: java.sql.SQLException: No suitable driver
解决方案:下载 mysql-connector-java-8.0.22.jar 文件,并复制到 java 安装目录下的 jre/lib/ext 文件夹下
jar包下载地址:MySQL :: Begin Your Download