scrapy框架爬虫定时爬取

本文介绍了如何使用Crontab配合Scrapy框架实现定时爬取任务。Crontab是Unix系统中用于设定周期性执行任务的工具,而Scrapy本身不提供定时功能。在Ubuntu系统中开启crontab服务并编辑配置文件,添加Scrapy爬虫的执行命令和执行频率,从而达到定时爬取的目的。
摘要由CSDN通过智能技术生成

        使用crontab来执行scrapy定时爬取的需求。原因是在scrapy框架中,没有定时爬取的设置选项。


1. 什么是Crontab?

        Crontab命令是Unix系统和类Unix系统中,用来设置周期性执行的指令。该命令从标准输入设备读取指令,并将其存放在“Crontab”文件中,以供后期读取和执行。Crontab所存的指令,被守护进程激活。crond常常在后台运行,以一分钟为间隔检查是否有预定的作业需要执行,这类作业一般成为cron jobs。


1. 打开Ubuntu中的crontab功能

        在Ubuntu中,crontab功能默认是关闭的,需要我们自己打开。

emacs  /etc/rsyslog.d/50-default.conf
        所打开的文件中,将
cron.*                 /var/log/cron.log

这一行的注释打开。

        然后重启系统服务,使刚才的改变生效。命令是:

$ sudo service syslog restart

2. contab的命令格式

            

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值