外部的标准镜像,肯定满足不了公司的实际要求咯~~
所以,根据同事的需求,重新制作了这个包。
其中可用库为tensorflow,numpy, pandas,scikit-learn,jieba,gensim, opencv,requests以及与hdfs文件系统的互访。
因为公司不可以直接直外网,所以dockerfile里引入了http代理。
作个记录。
这里需要注意的细节是
1,apt-get upgrade之后,要重新导入http代理的环境变量,否则不生效的。
2,datatools为自己的whl,官方没得找
3,sources.list为阿里的镜像源
4,rm -rf /etc/apt/sources.list.d/*动作是因为这里有国外的镜像源,有时访问不到。
5,sasl 的安装比较奇特,需要先apt-get install libsasl2-dev -y -q
6,opencv-contrib-python安装也奇特,要先安装libsm6,libxrender1,libxext-dev.
FROM tensorflow/tensorflow:1.14.0-gpu-py3-jupyter MAINTAINER pm COPY ./datatools-1.0.0-py2.py3-none-any.whl /tmp/ COPY ./sources.list /etc/apt/sources.list RUN export http_proxy=http://xxx.local:8080 \ && export https_proxy=xxx:8080 \ && export ftp_proxy=xxx.local:8080 \ && rm -rf /etc/apt/sources.list.d/* \ && apt-get -y -q update \ && apt-get -y -q upgrade RUN export http_proxy=http://xxx.local:8080 \ && export https_proxy=xxx.local:8080 \ && export ftp_proxy=xxx.local:8080 \ && apt-get install libsasl2-dev -y -q\ && apt-get install libsm6 -y -q\ && apt-get install libxrender1 -y -q\ && apt-get install libxext-dev -y -q\ && pip install sasl \ && pip install requests \ && pip install /tmp/datatools-1.0.0-py2.py3-none-any.whl \ && pip install requests \ && pip install pandas \ && pip install scikit-learn \ && pip install jieba \ && pip install gensim \ && pip install opencv-contrib-python \ && pip install thrift \ && pip install pyhive \ && pip install configparser \ && pip install pandas \ && pip install hdfs \ && pip install sqlparse \ && pip install thrift-sasl \ && echo "finished!!!"