Python爬虫：scrapy定时运行的脚本

最新推荐文章于 2024-06-28 15:39:28 发布

彭世瑜

最新推荐文章于 2024-06-28 15:39:28 发布

阅读量4.6k

点赞数 2

分类专栏： Python scrapy

本文为博主原创文章，欢迎转载，请注明出处

本文链接：https://blog.csdn.net/mouday/article/details/81514569

版权

Python 同时被 2 个专栏收录

614 篇文章 36 订阅

订阅专栏

scrapy

35 篇文章 2 订阅

订阅专栏

原理：

1个进程 -> 多个子进程 -> scrapy进程

代码示例

将以下代码文件放入scrapy项目中任意位置即可

# -*- coding: utf-8 -*-

# @File    : run_spider.py
# @Date    : 2018-08-06
# @Author  : Peng Shiyu

from multiprocessing import Process
from scrapy import cmdline
import time
import logging

# 配置参数即可, 爬虫名称，运行频率
confs = [
    {
        "spider_name": "hexun_pdf",
        "frequency": 2,
    },
]


def start_spider(spider_name, frequency):
    args = ["scrapy", "crawl", spider_name]
    while True:
        start = time.time()
        p = Process(target=cmdline.execute, args=(args,))
        p.start()
        p.join()
        logging.debug("### use time: %s" % (time.time() - start))
        time.sleep(frequency)


if __name__ == '__main__':
    for conf in confs:
        process = Process(target=start_spider,
                          args=(conf["spider_name"], conf["frequency"]))
        process.start()
        time.sleep(10)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

彭世瑜

关注关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫：scrapy定时运行的脚本

原理：1个进程 -&gt; 多个子进程 -&gt; scrapy进程代码示例将以下代码文件放入scrapy项目中任意位置即可# -*- coding: utf-8 -*-# @File : run_spider.py# @Date : 2018-08-06# @Author : Peng Shiyufrom multiprocessing import...
复制链接

扫一扫