python中定时执行爬虫文件方法

我们爬取数据的时候,经常会希望定时运行爬虫,一般在凌晨的时候执行,那样挂服务器上就会减轻很大的负荷,所以我们就需要定时的任务,本文使用了scrapy框架,然后定时执行爬虫代码的方法。

声明:此方法不一定是最好的方法,但是肯定是能达到效果的方法。

网上有很多的代码介绍,最多的就是下面的方法:

import time
from scrapy.cmdline import execute
import sys
import os
import datetime

def doSth():
    execute(['scrapy','crawl','lcp'])

# 想几点更新,定时到几点
def time_ti(h=20, m=24):
    while True:
        now = datetime.datetime.now()
        # print(now.hour, now.minute)
        if now.hour == h and now.minute == m:
            doSth()
        # 每隔60秒检测一次
        time.sleep(60)


doSth()

但是上面的方法执行一次就结束了,原因可能是cmdline是scrapy框架自带的,开启的是一个主线程,任务完成主线程撤销,所以就执行一次就结束了,完全达不到我们的要求。

所以下面的方法是最简单的方法。

import time
import sys
import os
import datetime


def Dingshi():
    while True:
        os.system("scrapy crawl lcp")#lcp是我们爬虫的代码名字哦
        time.sleep(60) 

Dingshi()

我们直接就是在Linux服务器上执行一次这个Dingshi()的方法就可以了。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值