subprocess.Popen使用及wait()的简单描述

最新推荐文章于 2025-01-10 08:19:00 发布

默默前行的旅者

最新推荐文章于 2025-01-10 08:19:00 发布

阅读量6.4k

点赞数 1

分类专栏： python多进程文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43229819/article/details/107227540

版权

python多进程专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一种通过子进程单独运行爬虫并设置时间限制的方法，以防止单个爬虫故障影响整体任务。使用Python的subprocess模块，为每个爬虫设定执行周期，超时则自动终止，确保系统稳定。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

写爬虫项目时，为防止某一个爬虫挂了影响到其他爬虫的进行，所以对爬虫单独开启一个进程，然后设置每个爬虫时间范围，如果超出了这个时间，则将该爬虫的进程kill掉，这样可以不影响其他爬虫任务的进行。使用subprocess模块


```python
# scrapy crawl *** -a taskid=***
    spider_name = gbl.gConfig.get('spiders_info').get('gxmobile').get(spider_type)
    cmd = [env_path, 'crawl', spider_name, '-a', f'taskid={task_id}']
    p = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE,
                         cwd=f'{project_path}')

    #  必须在执行周期时间之内执行完成
    try:
        p.wait(timeout=gbl.gConfig.get('spiders_info').get('gxmobile').get('timeout').get(spider_type))
        gbl.gLogger.info(f'run spider done for {task_id}!')
        return True
    except Exception as e:
        gbl.gLogger.error(f'async_run_spider failed {task_id}, desc: {e}->{traceback.format_exc()}')
        p.kill()
        return False

这里展现的是使用方法，具体的参数这里我就介绍一个这里用到的，就是cwd参数，这个参数的意思是所需进行任务的路径，比如我这里写的scrapy爬虫，那么我需要将路径切换为这个scrapy项目下才可以开启爬虫。
然后就是wait()使用，设置timeout参数的值就可以，如果没有在规定时间内完成任务，那么就会出错。

在这里插入图片描述

默默前行的旅者

博客等级

码龄7年

228
原创

239
点赞

381
收藏

743
粉丝

关注

私信

热门文章

分类专栏

python高性能 5篇
MySQL 10篇
FastApi 2篇
Python 基础 22篇
Linux 1篇
redis 1篇
vue 1篇
前端大杂烩 66篇
node 1篇
JS 41篇
jQuery 12篇
LeetCode 10篇
机器学习 4篇
python多进程 2篇
pandas 2篇
numpy 9篇
算法 1篇
Flask 1篇
Django 12篇
windows操作 1篇
爬虫 1篇
tornado 1篇

展开全部收起

最新评论

el-image 增加图片下载和删除功能
六六978: 你太棒啦
el-image 增加图片下载和删除功能
宝码香车: 你的笔触细腻如丝，‌文字里藏着诗和远方，‌令人陶醉不已。先‌点赞，收藏，每当遇到不解的bug时，拿出来观摩一下，或许能有启发！欢迎到我的博客指导
el-image 增加图片下载和删除功能
鸽鸽程序猿: 这篇文章实在是太棒了！内容丰富，论述清晰，代码实例更是琳琅满目，让人阅读起来津津有味。博主的专业素养和用心程度从中可见一斑，无疑为读者提供了一笔宝贵的知识财富。文章从基础概念出发，由浅入深地阐述了编程的核心思想。在阅读过程中，我感受到了博主对编程的热爱和敬业精神，他/她用通俗易懂的语言，将复杂的编程知识讲解得淋漓尽致。这使得读者在阅读过程中既能够掌握知识，又能够保持兴趣。也欢迎您来逛逛我的博客哦~~在此提前感谢您对我的互/三/支持~~
el-image 增加图片下载和删除功能
Little Frog: 优质好文，博主对细节的把控非常好，每次都能学到很多新知识，感谢博主的用心分享。
python日志模块，按天自动切换
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。