Docker 部署本地爬虫项目到服务器

笔记:一直想写一篇博客的,那就趁着周末闲暇时光记录一下。

目录

一、前提准备

二、Docker部署爬虫示例

整体梳理

1、打包构建本地项目镜像

2、在 hub 网站上 创建一个仓库。

3、将本地镜像与hub上的仓库打上标签

4、确保已登录 Dockerhub 账号

5、推送镜像到 Dockerhub 仓库中

6、推送上传成功可去 hub 上查看 

7、拉取 hub 镜像 

8、测试运行


一、前提准备

我是 Windows 11 环境的,要先整一个 Docker Desktop 对于它的安装这里不记录,可以参考一下这篇博客(挺详细的) Docker Desktop 安装使用教程_dockerdesktop安装-CSDN博客

二、Docker部署爬虫示例

首先要有你本地的爬虫项目,想省事的朋友,我这里准备了测试项目,git 地址:bind_news · YXHLHM/docker_test - 码云 - 开源中国 (gitee.com) mysql 表在 init 文件中。

结构如下图:

  • 整体梳理

  • 打包 项目依赖命令:
pipreqs ./ --encoding=utf-8
  • Dockerfile:运行 main.py  (更多的编写命令可以百度查一下)

  • main.py:运行要执行的爬虫脚本

这里注意要启动的爬虫脚本命令  /bind_news/aaa_inf3.py   bind_news 是你 Dockerfile 中创建的工作目录。

下面进行 docker 相关的操作

1、打包构建本地项目镜像

cmd 进入本地项目根目录进行构建:要先运行起你的 Docker Desktop

docker build -t csdn:v1.0.0 .

# csdn   -- 镜像的名称 -- 随便起
# v1.0.0 -- 版本标签 -- 随便起 
# . 是将 Dockerfile 所在的工作目录 (项目根目录) 下的所有的文件进行构建,这里是将爬虫项目的所有文件构建打包,

2、在 hub 网站上 创建一个仓库。

这个是外网要挂一个代理,它地址:Docker Hub

3、将本地镜像与hub上的仓库打上标签

先查看本地镜像:docker images 

docker tag  160e513ebf4b  yxhlhm/csdn:v1.0.0

# docker tag 镜像id dockerhub账号名称/hub仓库名称:标签

4、确保已登录 Dockerhub 账号

docker login -u 用户名 -p 密码

如果提示不让执行,就直接输入:docker login 进行键入登录。下图登录成功

或者直接用Docker desktop 登录你的 hub 账号就ok,下图:

出现问题的话可以去看看:docker login Error response from daemon: Get "https://registry-1.docker.io/v_mob64ca12db3721的技术博客_51CTO博客icon-default.png?t=N7T8https://blog.51cto.com/u_16213344/7074965

5、推送镜像到 Dockerhub 仓库中

docker push yxhlhm/csdn:v1.0.0

docker push dockerhub账号/dockerhub仓库名称:标签

6、推送上传成功可去 hub 上查看 

7、拉取 hub 镜像 

docker pull yxhlhm/csdn:v1.0.0

8、测试运行

1、可以直接在 Docker desktop 上 run 运行:

2、服务器拉取运行

docker pull yxhlhm/csdn:v1.0.0

简单 run 一下:

docker run 镜像ID

MySQL 中:

其实把它想成 git 就好理解了。

拜,简单记录一下。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
对于使用Docker部署Python爬虫,你可以按照以下步骤进行操作: 1. 首先,你需要创建一个Dockerfile,其中包含了构建你的Python爬虫所需的环境和依赖。你可以使用`FROM python:3`指令来选择一个基础镜像,然后使用`WORKDIR`指令设置工作目录,接着使用`COPY`指令将你的爬虫代码复制到容器中。 2. 在Dockerfile中,你可以使用`RUN`指令来安装Python依赖库,例如使用`pip install`命令安装所需的库。 3. 如果你的爬虫需要访问外部资源或者保存数据,你可以使用`VOLUME`指令来设置共享目录,以便在容器内外进行数据交互。 4. 构建Docker镜像,你可以使用`docker build`命令,指定Dockerfile的路径和镜像的名称。例如:`docker build -t pythonspider:v1 .`。 5. 运行Docker容器,你可以使用`docker run`命令,指定容器的名称、共享目录和镜像名称。例如:`docker run -d --name myspider -v /host/directory:/container/directory pythonspider:v1`。这将在后台运行一个名为`myspider`的容器,并将主机目录`/host/directory`与容器内目录`/container/directory`进行共享。 通过以上步骤,你就可以使用Docker部署你的Python爬虫了。请注意,这只是一个简单的示例,你可能需要根据你的具体需求进行适当的调整。希望对你有所帮助!\[2\]\[3\] #### 引用[.reference_title] - *1* [python基础教程:Docker部署Python爬虫项目的方法步骤](https://blog.csdn.net/haoxuan05/article/details/105256480)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [python爬虫步骤-Docker部署Python爬虫项目的方法步骤](https://blog.csdn.net/q6q6q/article/details/109342509)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Docker部署Python爬虫项目](https://blog.csdn.net/weixin_34312149/article/details/112952234)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

抄代码抄错的小牛马

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值