【celery 内存泄漏问题的排查-＞task_time_limit】

asihacker

已于 2022-03-16 20:27:56 修改

阅读量1.8k

点赞数 2

分类专栏： python基础文章标签： python kubernetes java

于 2022-03-16 20:09:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42887206/article/details/123533904

版权

python基础专栏收录该内容

4 篇文章 0 订阅

订阅专栏

博客讲述了在腾讯云集群上运行Celery时遇到的worker半小时重启的问题，原因是内存泄漏。经过分析资源监控图，发现内存使用在半小时内达到1000Mi后pod重启。解决方案包括移除任务的软硬时间限制，并参考了Celery的GitHub上的相关讨论。经过修改代码并观察，内存泄漏问题得到解决。

摘要由CSDN通过智能技术生成

项目场景：

提示：通过celery执行大量爬虫任务。

问题描述

提示：celery 的 worker每运行半小时就会重启，python3.8.7 celery5.2.3 redis作为中间人

@celery_app.task(soft_time_limit=60)  # time_limit 设置硬超时时间
def test(xxx):
    ...

原因分析：

提示：由于celery worker是在腾讯云集群上运行的，查看pod运行的资源监控图

pod limit设置为200Mi-800Mi，可以看到差不多半小时达到1000Mi后就pod就开始重启，内存泄漏应该就是造成pod不断重启的原因。

解决方案：

提示：1.google大法搜一搜，发现这个

不过是2013年的不知道还行不行。

2.再去celery github上看看

在issuess搜索oom,可以看到关于内存泄漏大量的bug反馈。
有说5.2.3已经修复了一个小泄漏（PS：看来还不是一个地方有问题），不过我们已经是最新版本了。

再继续看看，发现这个

可以看到13年到18年这个问题竟然还存在,我们可以去掉这个软硬时间试试看。

@celery_app.task  # 不再设置软硬超时时间
def test():
    ...

3.修改代码如上，更新到pod
运行一段时间后发现没有重启了，我们查看资源情况，如图

可以看到已经不会出现内存泄漏的问题。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【celery 内存泄漏问题的排查-＞task_time_limit】

项目场景：提示：通过celery执行大量爬虫任务。问题描述提示：celery 的 worker每运行半小时就会重启，python3.8.7 celery5.2.3 redis作为中间人@celery_app.task(soft_time_limit=60) # time_limit 设置硬超时时间def crawler_run(spider: str, url: str, **kwargs): """ 运行蜘蛛程序 :param spider: 蜘蛛名称 :pa
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。