问题描述
想在集群中使用第三方库,不知道怎么上传相关的依赖关系。
参考办法
开始找到相关解决方法主要有两种:
- 一是通过virtualenv为每个程序创建互不干扰的虚拟环境来运行;
- 二是通过anaconda进行安装包和环境的管理。
相关教程:
但是上面的教程解决的都是driver(master)的环境问题,并没有解决worker(executer,slaver)的问题。而且对于实际情况,并不能保证打包环境和slave端的运行环境一致。
后来参考了Yarn的Pypark如何与Redis交互。
实际操作
情况介绍:服务器A中安装了需要依赖的package,服务器B中有相关代码ÿ