上周像往常一样例行检查线上机器性能,突然发现一个服务的内存使用率是这样的:
很显然该服务存在内存泄漏问题,赶紧排查问题。
问题排查
首先确定内存泄漏问题出现的时间,发现在该时间点的上线有两次代码提交,其中一个就是我的。于是立刻排查这两次代码的改动,确定了另一个同事的代码不可能会有内存问题后(因为另一个同事的上线仅仅修改了配置)我知道肯定是自己的代码出现了问题。
确定了问题所在后赶紧把自己的代码回滚掉,接下来就可以放心debug了。
Debug
什么是内存泄漏?
简单的讲就是程序员申请的内存在使用完后没有还给操作系统,由于笔者使用的是C++语言,因此内存泄漏一般是这样的:
obj* o = new obj();
...
// 使用完obj后没有delete掉
肯定有什么地方申请了内存后没有调用delete释放内存。
在这里介绍一下笔者的代码改动,我的任务其实是重构一段代码,把这段代码并行化。也就是旧的逻辑是在一个线程中串行执行的,现在我要把这段逻辑放到两个线程中并行执行,这是最让人头疼的任务之一,并行化改造是比较容易出bug的。
接下来梳理了一遍中所有内存的申请和释放,这其中包括: