项目背景:采集数据的爬虫,包裹数据的采集,储存,验证码识别
使用到的工具:objgraph
使用:objgraph.show_growth()
tuple 379516 +38098
list 114790 +11333
dict 96267 +7956
builtin_function_or_method 33475 +2857
weakref 35287 +2796
Operation 16950 +1784
_InputList 16950 +1784
Tensor 16798 +1768
TF_Output 16721 +1760
Dimension 11913 +1254
分析流程
先在 数据采集模块 隔一段时间 打印一下增长情况,
观察发现 没有内存泄漏
然后去数据储存模块 打印增长情况,
依旧没有内存泄漏
在就剩下验证码识别模块了,用的tensorflow2.0,果然每次识别,
对象都会增长很多,
分析代码后 发现 每次识别的时候都加载一次模型,那肯定增长的厉害呀,处理下,
继续观察,依然存在增长情况,但是没有之前那么验证,去官网查看了下,
解决方案:每次使用完模型需要clear_session,然后测试程序,完美解决