我在Ubuntu 15.10中使用Docker容器为Pyspark jupyter / pyspark-notebook工作.我需要安装具有所有依赖项的folium并在容器中运行Pyspark脚本.我成功安装了Docker,拉出了图像并使用命令运行它
docker run -d -p 8888:8888 -p 4040:4040 -v /home/$MYUSER/$MYPROJECT:/home/jovyan/work jupyter/pyspark-notebook
然后,我执行代码示例没有任何问题
import pyspark
sc = pyspark.SparkContext('local[*]')
# do something to prove it works
rdd = sc.parallelize(range(1000))
rdd.takeSample(False, 5)
我在/ opt / conda中查找了conda环境(正如它在documentation中所说的那样)但是我的/ opt文件夹中没有conda.然后,我安装了miniconda3和folium作为普通Python包的所有依赖项(不涉及Docker).
它不起作用.当我运行图像并尝试使用import folium导入包时,它找不到folium包:
ImportErrorTraceback (most recent call last)
in ()
----> 1 import folium
ImportError: No module named 'folium'
所以问题可以归结为两个问题:
>集装箱的conda在哪里?
>如何将我需要的Python包安装到容器中?