已经通过pip install 安装库了,但是运行pyspark还是找不到
第一步:找到安装库的位置,比如我的是/usr/lib/python2.6/site-packages,将需要用的库打成zip包

第二步:sc.addPyFile添加zip文件

第三步:命令使用--py-files引用zip文件

第四步:运行成功

本文介绍了解决pyspark运行时找不到已通过pip install安装的自定义库的方法,包括找到库位置、打包成zip、使用sc.addPyFile和--py-files命令引用zip文件,最终实现运行成功。
已经通过pip install 安装库了,但是运行pyspark还是找不到
第一步:找到安装库的位置,比如我的是/usr/lib/python2.6/site-packages,将需要用的库打成zip包

第二步:sc.addPyFile添加zip文件

第三步:命令使用--py-files引用zip文件

第四步:运行成功

9297

被折叠的 条评论
为什么被折叠?