使用Docker部署Scrapy爬虫

最新推荐文章于 2024-08-10 08:30:14 发布

wang_san_shi

最新推荐文章于 2024-08-10 08:30:14 发布

阅读量8.4k

点赞数 1

分类专栏： Docker

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wang_san_shi/article/details/48178689

版权

本文详细介绍了如何在Ubuntu系统上使用Docker部署一个基于Scrapy开发的简单爬虫，步骤包括：设置环境，使用setuptools打包Python程序，定义Dockerfile安装依赖，创建并启动容器，最后挂载主机目录查看下载内容。

摘要由CSDN通过智能技术生成

使用Docker部署Scrapy爬虫

1、目的与步骤

环境：Ubuntu14.04 LTS，爬虫程序使用scrapy开发，功能比较简单，就是下载百度贴吧第一页中所有帖子中的图片。

目的：将基于Scrapy开发的爬虫程序发布到docker容器中。

步骤：
a. 在主机上使用setuptools打包python程序，包括一个运行爬虫的命令行；
b. 定义dockerfile，内容包括安装ssh、pip、setuptools、scrapy，并挂载volume（/data）用来作为下载路径，然后创建镜像；
c. 由镜像启动容器，同时挂载主机目录（爬虫项目目录），然后安装程序；
d. 执行命令开始下载图片。

2、步骤一：打包爬虫程序

前提：在主机上安装pip，使用pip安装setuptools。

主机上的项目目录结构为：

baidutieba
|--baidutieba
| |--spiders
| | |--__ini

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。