python项目部署到docker_python爬虫项目在docker中的部署实践

1. 选择镜像

这里选择基础镜像时是有讲究. 一是应当尽量选择官方镜像库里的基础镜像;二是应当选择轻量级的镜像做底包.

就典型的 Linux 基础镜像来说,大小关系如下:Ubuntu > CentOS > Debian> Alpine

Alpine Docker 镜像也继承了 Alpine Linux 发行版的这些优势。相比于其他 Docker 镜像,它的容量非常小,仅仅只有 5 MB 左右(对比 Ubuntu 系列镜像接近 200 MB),且拥有非常友好的包管理机制apk。

2. 拷贝文件

相对于 ADD,优先使用 COPY指令

另外发现拷贝文件夹是把文件夹的内容拷贝进去, 而不是把整个目录拷贝进去, 坑爹 最后使用dockerignore解决这个问题.1copy. /zk8/

.dockerignore文件1

2

3

4

5chromedriver

*.sh

.*

**/__pycache__/

Dockerfile

3. 测试 dockerfile

3.1 镜像加速

在本地测试的时候, 发现连Alpine都拉取不下来, 此处感谢伟大的 great wall. 于是选择阿里云加速.

右键点击桌面顶栏的 docker 图标,选择 Preferences ,在 Daemon 标签(Docker 17.03 之前版本为 Advanced 标签)下的 Registry mirrors 列表中

将 https://xxxxxxxxx.mirror.aliyuncs.com 加到 “registry-mirrors” 的数组里,点击Apply & Restart 按钮,等待 Docker 重启并应用配置的镜像加速器。

ps: 就是阿里云加速, 在后续的安装软件中也是特别慢, 此处建议在云服务器上(免费的谷歌云)操作.

3.2 测试1

2docker build -t zk8:0.1 . # 制作 image

docker run -ti --rm zk8:0.1 /bin/sh # 启动容器结束后删除, 用这种方法可以非常方便测试

前期可以通过 shell 进入到容器里面测试, 在里面尝试安装相应的软件包, 然后再写 dockerfile会比较方便

4. 安装软件包

爬虫用 python 写的, 并且使用了 selenium + 无头浏览器. 所以安装包要写在 dockerfile里, 文件如下:1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27FROM alpine

RUNmkdir -p /zk8

COPY. /zk8/

# install python

RUNecho "**** install python ****" && \

apk add --no-cache python3 && \

if [ ! -e /usr/bin/python ]; then ln -sf python3 /usr/bin/python ; fi && \

echo "**** install pip ****" && \

python3 -m ensurepip && \

rm -r /usr/lib/python*/ensurepip && \

pip3 install --no-cache --upgrade pip setuptools wheel && \

if [ ! -e /usr/bin/pip ]; then ln -s pip3 /usr/bin/pip ; fi

# install python package

RUNapk add --no-cache py-lxml && \

apk add --no-cache chromium && \

apk add --no-cache chromium-chromedriver && \

if [ -e /usr/bin/chromedriver ]; then ln -s /usr/bin/chromedriver /zk8/chromedriver ; fi && \

pip install selenium && \

pip install bearychat && \

pip install pyquery

WORKDIR/zk8

CMDpython3 main.py

5. 发布到 dockerhub

建议建立自己的私有仓库, 因为 dockerhub 可以免费使用一个私有仓库, 此处上传到 dockerhub.1

2

3

4

5docker login # 登录自己的 dockerhub 帐号

docker tag zk8:0.1 levonfly/zk8:0.1 # 此处打 tag, 格式要以 用户名/镜像名字:版本号

docker push levonfly/zk8:0.1 # 推送到 dockerhub

dockerhub 上还可以 link 到github, 即 github 一更新代码就重新 build.

接下来就是激动人心的时刻, 在任何安装 docker 的机器上直接运行自己的爬虫.1

2docker pull levonfly/zk8:0.1

docker run -d --name zk8 levonfly/zk8:0.1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值