定时爬虫

最新推荐文章于 2021-12-07 15:31:43 发布

置顶 spider_fu

最新推荐文章于 2021-12-07 15:31:43 发布

阅读量638

点赞数

分类专栏：其他文章标签： linux python shell

本文链接：https://blog.csdn.net/fuzizhu1/article/details/103806871

版权

其他专栏收录该内容

10 篇文章 0 订阅

订阅专栏

设置主函数，

import os
import time
while True：
	os.system("scrapy crawl spider")
	time.sleep(86400)  #每隔1天运行一次 24*60*60=86400s

这种方式可以实现每隔一天爬取一次，但每次都会偏移爬取所用的时间。
如果避免这种偏移，可使用crontab
在linux系统中，写一个脚本corn.sh

#!/bin/bash
# source /etc/profile
cd /E/home/user/project/temp/project &&

/E/home/user/.conda/envs/env/bin/scrapy crawl spider  >> /E/home/user/project/logs/log

使用命令crontab -e打开定时，将前面所写的脚本添加进去

* * * * * sh corn.sh

可以用crontab -l查看定时任务

优惠劵

spider_fu

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
定时爬虫

设置主函数，import osimport timewhile True： os.system("scrapy crawl spider") time.sleep(86400) #每隔1天运行一次 24*60*60=86400s这种方式可以实现每隔一天爬取一次，但每次都会偏移爬取所用的时间。如果避免这种偏移，可使用crontab在linux系统中，写一个脚本corn.sh#!...
复制链接

扫一扫