首先说明下,作者本人是C/C++程序员出道。C/C++什么都好,就是内存管理让人头疼。对于这种没有Garbage Collection的语言, C 和 C++ 程序中完全由程序员自主申请和释放内存,稍不注意,就会在系统中导入内存错误。同时,内存错误往往非常严重,一般会带来诸如系统崩溃,内存耗尽(OOM),逻辑异常(内存踩踏)这样严重的后果。这些后果,都是无法接受的。最要命的是内存泄漏通常是无声无息的发生。存在内存错误的 C 和 C++ 程序会导致各种问题。如果它们泄漏内存,则运行速度会逐渐变慢,并最终停止运行;如果覆盖内存,则会逻辑异常,很容易受到hacker的攻击。
说了这么多,内存泄漏的严重性,那到底什么是内存泄漏呢?
内存泄漏一般情况下是指从堆中申请的内存没有释放。堆的概念可以在我的怎样深入理解堆和栈这篇文章中寻找到答案。应用程序调用malloc,realloc,new函数从堆中申请一块内存,在使用完毕后,需要调用free/new来释放内存。如果缺少释放,就会导致内存泄漏。久而久之,整个系统的内存将会慢慢耗尽。
那我们该如何及时发现内存泄漏呢?下面列举下:
-
代码review阶段,这个阶段的代价能够发现简单的内存泄漏问题
-
代码静态检测工具,coverity等等。这类工具比较强大,绝大部分的内存泄漏风险都能检测出来。
-
运行阶段,配合系统有内存监视工具,收集一段时间内的堆栈内存信息,观测增长趋势,来确定是否有内存泄漏。例如:ps,top,cat /proc/{pid}/status,cat /proc/{pid}/maps等等。
-
运行阶段,内存检测工具。这类工具也比较多。常用如下:
在这几款工具中,设置最简单的应该是memwatch了,和dmalloc一样,它能检测未释放的堆内存,内存被释放多次,内存非法访问问题。
它之所以是简单好用,是因为他根本不需要安装,只是一段代码,需要include头文件memwatch.h和源代码包含memwatch.c,编译需要加上-DMEMWATCH -DMW_STDIO。例如:
gcc -DMEMWATCH -DMW_STDIO hicore.c memwatch.c -o hicore
memwatch输出文件名称为memwatch.log,运行期间所以内容都会输出在stdout上。
举个例子吧(这个例子简单的令人发指,只是为了说明思路):
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <memwatch.h>
int main() {
char *hello;
if ((hello = (char *) malloc(sizeof(char))) == NULL) {
perror("Cannot allocate memory.");
return -1;
}
return 0;
}
编译命令:
gcc -DMEMWATCH -DMW_STDIO test.c memwatch.c -o test
memwatch.log的內容如下:
============= MEMWATCH 2.71 Copyright (C) 1992-1999 Johan Lindh =============
Started at Mon May 27 22:48:47 2019
Modes: __STDC__ 32-bit mwDWORD==(unsigned long)
mwROUNDALLOC==4 sizeof(mwData)==32 mwDataSize==32
Stopped at Mon May 27 22:48:47 2019
unfreed: <1> test.c(7), 1 bytes at 0x805108c {FE .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .}
Memory usage statistics (global):
N)umber of allocations made: 1
L)argest memory usage : 1
T)otal of all alloc() calls: 1
U)nfreed bytes totals : 1
从文件的内容可以看出,在程序执行到test.c的第7行时,堆内存未释放,该段内存的大小为1 byte。
Memwatch 的优点是无需特別配置,不需安装便能使用,但缺点是它会拖慢程序的运行速度,尤其是释放内存时它会作大量检查。但它比mtrace和dmalloc多了一项功能,就是能模拟系统内存不足的情況,使用者只需用mwLimit(long num_of_byte)函数来限制程式的heap memory大小(以byte单位)。
详细的使用方法和运行原理可以在README中寻找答案。
进阶1
有人会问了还有没有其他的方法来检测内存泄漏呢?答案是有的。
重载new 和 delete。这也是大家编码过程中常常使用的方法。当然也可以重载malloc和free。只是在C语言中,没有重载的概念。暂且就叫重载吧。
测试代码:
#include<iostream>
using namespace std;
//---------------------------------------------------------------
// 内存记录
//---------------------------------------------------------------
class MemInfo {
private:
void* ptr;
const char* file;
unsigned int line;
MemInfo* link;
friend class MemStack;
};
//---------------------------------------------------------------
// 内存记录栈
//---------------------------------------------------------------
class MemStack {
private:
MemInfo* head;
public:
MemStack():head(NULL) { }
~MemStack() {
MemInfo* tmp;
while(head != NULL) {
free(head->ptr); // 释放泄漏的内存
tmp = head->link;
free(head);
head = tmp;
}
}
void Insert(void* ptr, const char* file, unsigned int line) {
MemInfo* node = (MemInfo*)malloc(sizeof(MemInfo));
node->ptr = ptr; node->file = file; node->line=line;
node->link = head; head = node;
}
void Delete(void* ptr) {
MemInfo* node = head;
MemInfo* pre = NULL;
while(node != NULL && node->ptr!=ptr) {
pre = node;
node = node->link;
}
if(node == NULL)
cout << "删除一个没有开辟的内存" << endl;
else {
if(pre == NULL) // 删除的是head
head = node->link;
else
pre->link = node->link;
free(node);
}
}
void Print() {
if(head == NULL) {
cout << "内存都释放掉了" << endl;
return;
}
cout << "有内存泄露出现" << endl;
MemInfo* node = head;
while(node != NULL) {
cout << "文件名: " << node->file << " , " << "行数: " << node->line << " , "
<< "地址: " << node->ptr << endl;
node = node->link;
}
}
};
//---------------------------------------------------------------
// 全局对象 mem_stack记录开辟的内存
//---------------------------------------------------------------
MemStack mem_stack;
//---------------------------------------------------------------
// 重载new,new[],delete,delete[]
//---------------------------------------------------------------
void* operator new(size_t size, const char* file, unsigned int line) {
void* ptr = malloc(size);
mem_stack.Insert(ptr, file, line);
return ptr;
}
void* operator new[](size_t size, const char* file, unsigned int line) {
return operator new(size, file, line); // 不能用new
}
void operator delete(void* ptr) {
free(ptr);
mem_stack.Delete(ptr);
}
void operator delete[](void* ptr) {
operator delete(ptr);
}
//---------------------------------------------------------------
// 使用宏将带测试代码中的new和delte替换为重载的new和delete
//---------------------------------------------------------------
#define new new(__FILE__,__LINE__)
//---------------------------------------------------------------
// 待测试代码
//---------------------------------------------------------------
void bad_code() {
int *p = new int;
char *q = new char[5];
delete []q;
}
void good_code() {
int *p = new int;
char *q = new char[5];
delete p;
delete []q;
}
//---------------------------------------------------------------
// 测试过程
//---------------------------------------------------------------
int main() {
good_code();
bad_code();
mem_stack.Print();
system("PAUSE");
return 0;
}
其思路:每次new中开辟一块内存就用链表把这个内存的信息保存下来,每次用delete删除一块内存就从链表中删除这块内存的记录。
malloc和free的方式也一样。用宏的方式重实现malloc和free。
进阶2
还有没有其他的方法呢?当然有啦,就是采用智能指针(C++),这部分讲起来内容会比较多。只提供个思路吧。
终极
很明显,终极解决内存泄漏问题的方法就是良好的编码习惯。使用内存分配函数,一旦释放完毕,记得释放。这一部分,需要各位开发人员多多编码。自己有对内存分配函数的一种敬畏。时刻记得内存的释放。