python内存池机制什么时候消失_python程序中memory leak排查&gc机制

最新推荐文章于 2021-11-19 16:29:19 发布

龚匠

最新推荐文章于 2021-11-19 16:29:19 发布

阅读量195

点赞数

文章标签： python内存池机制什么时候消失

本文链接：https://blog.csdn.net/weixin_30312037/article/details/112959120

版权

本文介绍了Python内存泄露的排查方法，包括利用pylmer监控内存、关注Python模块和本地库。讨论了Python的垃圾回收（GC）机制，如引用计数、循环引用检测等，并提出在没有循环引用的情况下可以考虑禁用GC以提高性能。文章还提醒注意内存池机制可能导致的小对象不释放，以及GC在处理循环引用时的时间复杂度问题。

摘要由CSDN通过智能技术生成

agenda

memory leak排查

python gc机制

后记

所有分析都是基于cpython

memory leak排查

通常内存泄漏比较难排查，可以借助工具和开闭实验. 主要问题是如何定位泄漏部分, 可能自己写的代码泄漏, 也可能是调用库造成的泄漏, 可能是py程序中忽略的引用造成的, 也可能引用或者自己native so造成. 之前负责调查一个7x24的线上服务, 服务启动后, 随着请求内存不不规则增加, 从启动时的1G多占用一天内能达到14G之多.

思路是:

watch_result = watch py heap memory diff via pylmer

if watch_result is continues increase:

focus on py module

else:

focus on naive module

通过一段时间的观察(pylmer模块扫描这个py heap非常消耗性能, 在线上抽样数据需要注意), py heap有涨有跌, 这里随着业务场景复杂度有差异, 之前负责的业务在单位时间内会保存一些的图片(numpy.array), 这里会带来局部时间的不稳定, 局部时间内确实内存增长迅猛, 所以需要根据业务场景观察一个周期内的内存变化.

当时锁定在native library: tensorflow, cv2, numpy这几块儿上, 由于发现越是高峰期泄漏越发明显, 首要怀疑tensorflow的问题, 简单写了一个每个模型并发做FG实验, 观察内存没有变化, 排除tensorflow. 后续绕了一大圈最后solid repro是tensorflow的memory leak, 开始的实验没有没有严格按照业务场景来.当然是后话, 由于是第一次排查py memory leak, 对于pmlyer的结果并不是特别有信心, 感觉上tensorflow作为广泛使用框架,不应该有这个问题, 犯了主观主义的错误.

当时初步怀疑是py code的问题.

现在反过来想, 上面用py伪代码的思路是ok, 通过单位周期的内存变化就可以大体定位py程序是否有泄漏, 比较糟糕的是py和native都有泄漏.

python gc机制

调查python内存问题就一定要了解python内存机制

reference counting

python中的垃圾回收基于引用计数, 优点是简单高效, 缺点不能完全摆脱互引用(虽然有cycle reference detect), 引自官网:

The principle is simple: every object contains a counter, which is incremented when a reference to the object is stored s