定时爬虫部署到ubuntu16.4

最新推荐文章于 2024-05-08 04:04:59 发布

ztfDeveloper

最新推荐文章于 2024-05-08 04:04:59 发布

阅读量985

点赞数

分类专栏： Python Linux 文章标签：爬虫 ubuntu 脚本

本文链接：https://blog.csdn.net/zhutianfu521/article/details/78974035

版权

14 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

把你的scrapy爬虫写好后,我们就可以写脚本来执行爬虫
脚本的逻辑就是先进去到爬虫所在的文件夹然后执行scrapy crawl yourSpider(你的爬虫的名称)
有个注意点就是scrapy在脚本中要写它的绝对路径,通过命令which scrapy来获取路径
脚本内容

#!/bin/sh

cd /spider #此处写你爬虫的文件夹
/usr/local/bin/scrapy crawl yourSpider(你的爬虫的名称)

然后通过crontab -e命令去编辑

* */1 * * * sh (你脚本的绝对路径)

linux的crontab命令可以让脚本定时执行,命令的详细介绍在我的另一个博客里crontab命令详解

关闭保存后就会开始执行了,可以在爬虫中打印日志来关注执行情况

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注