Ubuntu<使用crontab执行定时爬虫任务>

之前在windows下使用python 脚本调用爬虫程序,做成定时任务的时候,都挺顺利的,以下是代码video_command.py

# -*- coding: utf-8 -*-
# !/usr/bin/python2.7
import os
import time
def run_spider(spider_name, folder_name):
    try:       
        command1 = 'scrapy crawl ' + str(spider_name)
        os.chdir('/python/shixi/' + str(folder_name))
        os.system(command1)
        #    print '******************'
        print time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
        #    print 'success'
        print command1
        print "----------------------------->>>>>>>>>>>>>>>>>>>done<<<<<<----------------------"
    except Exception, e:
        print e
if __name__ == '__main__':
    run_spider('qiyi1_spider', 'QIYI_movie')

然后创建了一个bat文件,然后使用windows自带的定时任务,调一下bat文件就可以了。

今天想要在Ubuntu上使用crontab来定时跑爬虫程序,于是将以上代码搬到Ubuntu上去,进入到项目的路径下,使用
scrapy crawl xxxx来执行的时候都能很真长的执行,使用shell运行video_command.py也能正常运行。但是放到crontab里边却死活跑不起来,以下是crontab -e中的代码:

53 15 * * *  sh /python/shixi/crontab3/start_crawl.sh >>/python/shixi/crontab3/log.text 2>&1

最后troubleshotting才发现问题的根源是在video_command.py里边,虽然直接运行爬虫,或者使用脚本来运行爬虫都能成功,但是不知道crontab内部是怎么写的,放上去之后,就找不到scrapy,于是加上以下路径就能找到了
这里写图片描述

完整的代码是:

# -*- coding: utf-8 -*-
# !/usr/bin/python2.7
import os
import time
def run_spider(spider_name, folder_name):
    try:       
        command1 = '/usr/local/bin/scrapy crawl ' + str(spider_name)
        os.chdir('/python/shixi/' + str(folder_name))
        os.system(command1)
        #    print '******************'
        print time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
        #    print 'success'
        print command1
        print "----------------------------->>>>>>>>>>>>>>>>>>>done<<<<<<----------------------"
    except Exception, e:
        print e
if __name__ == '__main__':
    run_spider('qiyi1_spider', 'QIYI_movie')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值