第五章:C/C++内存管理
1.C/C++内存分布
来看一段代码,回答一些问题:
int globalVar = 1;
static int staticGlobalVar = 1;
void Test()
{
static int staticVar = 1;
int localVar = 1;
int num1[10] = { 1, 2, 3, 4 };
char char2[] = "abcd";
const char* pChar3 = "abcd";
int* ptr1 = (int*)malloc(sizeof(int) * 4);
int* ptr2 = (int*)calloc(4, sizeof(int));
int* ptr3 = (int*)realloc(ptr2, sizeof(int) * 4);
free(ptr1);
free(ptr3);
}
1.选择题:
- 选项: A.栈 B.堆 C.数据段(静态区) D.代码段(常量区)
globalVar在哪里?____ staticGlobalVar在哪里?____
staticVar在哪里?____ localVar在哪里?____
num1 在哪里?____
char2在哪里?____ *char2在哪里?___
pChar3在哪里?____ *pChar3在哪里?____
ptr1在哪里?____ *ptr1在哪里?____
2.用一张图,说明上述问题:
3.说明:
1)栈又叫堆栈–非静态局部变量/函数参数/返回值等等,栈是向下增长的。
2)内存映射段是高效的I/O映射方式,用于装载一个共享的动态内存库。用户可使用系统接口创建共享共享内存,做进程间通信。(Linux课程如果没学到这块,现在只需要了解一下)
3)堆用于程序运行时动态内存分配,堆是可以上增长的。
4)数据段–存储全局数据和静态数据。
5)代码段–可执行的代码/只读常量
2.C的动态内存管理方式
1.C语言中,与动态内存管理有关的有四个函数:malloc/calloc/realloc/free
我们通过一段代码,来回忆一下它们的区别和用法:
void Test ()
{
int* p1 = (int*) malloc(sizeof(int));
free(p1);
// 1.malloc/calloc/realloc的区别是什么?
int* p2 = (int*)calloc(4, sizeof(int));
int* p3 = (int*)realloc(p2, sizeof(int)*10);
// 这里需要free(p2)吗?
free(p3);
}
2.它们的功能:
1)malloc
:是用来动态开辟空间的。
2)calloc
:相当于有初始化功能的malloc
。等价于malloc
+memset
。
3)realloc
:动态扩容。
4)free
:释放动态开辟的空间。
3.需要free(p2)吗?
不需要,因为realloc
在动态扩容时,如果空间够,那么p3
指向的空间就是p2
所指向的空间,释放p3
就是释放p2
;如果空间不够,realloc
就会先拷贝p2
中的内容到p3
中,再释放p2
,不需要再重复free(p2)
。
3.C++内存管理方式
C语言内存管理方式在C++中可以继续使用,但有些地方也无能为力,而且使用起来比较麻烦,因此C++又提出了自己的内存管理方式:通过new和delete操作符进行动态内存管理。
3.1new/delete操作内置类型
1.使用new开辟空间:
void Test()
{
// 动态申请一个int类型的空间
int* p1 = new int;
// 动态申请一个int类型的空间并初始化为10
int* p2 = new int(10);
// 动态申请10个int类型的空间
int* p3 = new int[10];
// 小括号是初始化,大括号代表开辟几个对应类型的空间
}
调试查看空间是否初始化了:
显然,只有p2
完成了初始化,其他的空间都没有初始化,这是因为,new
不自动处理内置类型。
如何初始化数组空间呢?
int* p4 = new int[10] {1, 2, 3};
int* p5 = new int[10] {};
调试查看:
发现,用方括号加大括号的方式,可以从前向后初始化数组空间,没有指明初始值的地方会被自动初始化成0。
2.使用delete释放new开辟的空间:
int main()
{
int* p1 = new int;
int* p2 = new int(10);
int* p3 = new int[10];
// 释放单个空间
delete p1;
delete p2;
// 释放多个空间
delete[] p3;
return 0;
}
注意:申请和释放单个元素的空间,使用new
和delete
操作符,申请和释放连续的空间,使用new[]
和delete[]
,一定要匹配起来使用,对号入座。
3.2new/delete操作自定义类型
1.new和delete真正的用途:
如果你认为,new
和delete
的作用只是将malloc
和free
语法简化的话,那你的格局就小了。new
和delete
真正的作用体现在自定义类型中。
思考一个问题:使用malloc
申请一块空间,里面放自定义类型数据,如何对这块空间初始化?答案是做不到,malloc
做不到对自定义类型的初始化,想要显示的调用构造函数也是不可取的(但是构造函数确实可以显示调用,后面再讲)。而new
可以做到在申请空间的同时,对里面的自定义类型数据初始化:
class A
{
public:
A(int a = 0)
: _a(a)
{
cout << "A():" << this << endl;
}
~A()
{
cout << "~A():" << this << endl;
}
private:
int _a;
};
int main()
{
// new/delete 和 malloc/free最大区别是
//new/delete对于 自定义类型 除了开空间还会调用构造函数和析构函数
A* p1 = (A*)malloc(sizeof(A));
A* p2 = new A(1); // 这里可以传参,直接调构造函数初始化
free(p1);
delete p2;
cout << endl;
// 内置类型是几乎是一样的
int* p3 = (int*)malloc(sizeof(int)); // C
int* p4 = new int;
free(p3);
delete p4;
cout << endl;
A* p5 = (A*)malloc(sizeof(A) * 3);
A* p6 = new A[3];
free(p5);
delete[] p6;
return 0;
}
输出结果:
A():0000015E88EB6C60
~A():0000015E88EB6C60
A():0000015E88EC3418
A():0000015E88EC341C
A():0000015E88EC3420
~A():0000015E88EC3420
~A():0000015E88EC341C
~A():0000015E88EC3418
可以发现:在申请自定义类型的空间时,new会调用构造函数,delete会调用析构函数,而malloc与free不会。
给自定义类型的数组空间初始化:
int main()
{
A* p = new A[3]{ A(3), A(4), A(7) };
// 甚至可以简写成 A* p = new A[3]{3, 4, 7};
delete[] p;
return 0;
}
调试查看:
调用构造函数初始化成功,这里又体现出了匿名对象一个很重要的作用。
2.感受一下new的魅力:写一个C++的链表
struct ListNode
{
ListNode* _next;
int _val;
ListNode(int val = 0)
:_val(val)
, _next(nullptr)
{}
};
int main()
{
ListNode* n1 = new ListNode(1);
ListNode* n2 = new ListNode(2);
ListNode* n3 = new ListNode(3);
ListNode* n4 = new ListNode(4);
ListNode* n5 = new ListNode(5);
n1->_next = n2;
n2->_next = n3;
n3->_next = n4;
n4->_next = n5;
// ...
return 0;
}
在C语言中,我们想创建一个链表,至少还要写一个创建节点的函数,由这个函数用malloc
申请一块空间给节点;对比C++,发现语法上简洁了不是一星半点,而且还可以在申请空间的时候,直接调用构造函数,完成初始化。
3.new在栈中的使用:
1)使用malloc
的原始写法:
//栈的类型定义
class Stack
{
//成员函数
public:
//构造函数
Stack(int capacity = 4) //给缺省值,如果什么也不传,就默认开辟4个数据的空间
{
if (capacity == 0)
{
_a = nullptr;
_top = _capacity = 0;
}
else
{
STDataType* tmp = (STDataType*)malloc(sizeof(STDataType) * capacity);
if (tmp == nullptr)
{
perror("malloc fail\n");
exit(-1); //程序退出,返回-1
}
_a = tmp;
_top = 0;
_capacity = capacity;
}
}
//拷贝构造函数
Stack(Stack& s)
{
//深拷贝
//开辟新空间
STDataType* tmp = (STDataType*)malloc(sizeof(STDataType) * s._capacity);
if (!tmp)
{
perror("malloc fail\n");
exit(-1);
}
_a = tmp;
//拷贝数据
memcpy(_a, s._a, sizeof(STDataType) * s.Size());
_capacity = s._capacity;
_top = s._top;
}
//销毁
~Stack()
{
free(_a);
_a = nullptr;
_top = _capacity = 0;
}
//成员变量
private:
STDataType* _a;
int _top;
int _capacity;
};
2)使用new
的写法:
class Stack
{
public:
Stack(size_t capacity = 4)
{
if (capacity == 0)
{
_a = nullptr;
_top = _capacity = 0;
}
else
{
STDataType* _a = new STDataType[capacity];
_top = 0;
_capacity = capacity;
}
}
//拷贝构造函数
Stack(Stack& s)
{
//深拷贝
//开辟新空间
STDataType* _a = new STDataType[s._capacity];
//拷贝数据
memcpy(_a, s._a, sizeof(STDataType) * s._top);
_capacity = s._capacity;
_top = s._top;
}
// 析构函数
~Stack()
{
delete[] _a;
_a = nullptr;
_top = _capacity = 0;
}
STDataType* _a;
int _top;
size_t _capacity;
};
发现代码明显简洁了不少,而且new
开空间失败不会返回0,但是会抛异常(我们之后再讲异常)。
3)来看这样一种场景:
我们想要通过一个函数,来创建一个栈,请问我们该如何设计这个函数?
- 想法一:
Stack func()
{
int n;
cin >> n;
Stack st(10);
return st;
}
int main()
{
Stack st1 = func();
return 0;
}
这种思路是借助了拷贝构造函数,时间和内存的开销都很大。
- 想法二:
Stack* func()
{
int n;
cin >> n;
Stack* ptr = new Stack(n);
return ptr;
}
int main()
{
Stack* st1 = func();
// ...
delete st1;
return 0;
}
这样的写法,实际上是new
了两次:
Stack* ptr = new Stack(n);
这句代码,实际上是开辟了一个有_array
,_size
,_capacity
的空间,是一个Stack
类的空间。然后第二层new
去调用这个类的构造函数,又开辟了一块空间,_array
指向这块空间。
delete
也执行了两次:
先调用这个类的析构函数,释放了_array
指向的空间。然后再delete
掉存_array
,_size
,_capacity
的空间。
4.operator new与operator delete函数(重点)
1.先简单提一下抛异常:
一般而言,申请空间是不会失败的,因为可控申请的空间很大,超过10亿。所以我们在一些线上oj题中,不用考虑空间开辟失败的情况。
但是如果空间真的不够,我们可以通过抛异常来处理:
int main()
{
try
{
char* p1 = new char[0x7ffffffff]; // 这是一个很大的空间,超过10亿
cout << "hello world" << endl;
}
catch (const exception& e)
{
cout << e.what() << endl;
}
return 0;
}
输出结果:(表示开空间失败)
bad allocation
先不用管代码为什么这样写,先跟着敲。简单了解一下:try
中的语句在从上向下执行时,如果遇到错误及一些异常情况,就会直接跳转到catch
语句,捕获异常信息。同时try
中异常位置向下的代码就不会再执行了。
2.operator new/operator delete
new
和delete
是用户进行动态内存申请和释放的操作符,operator new
和operator delete
是系统提供的全局函数,new
在底层调用operator new
全局函数来申请空间,delete
在底层通过operator delete
全局函数来释放空间。(以下部分现在看不懂很正常,了解即可)
/*
operator new:该函数实际通过malloc来申请空间,当malloc申请空间成功时直接返回;
申请空间失败,尝试执行空间不足应对措施,如果改应对措施用户设置了,则继续申请,
否则抛异常。
*/
void *__CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
{
// try to allocate size bytes
void *p;
while ((p = malloc(size)) == 0)
if (_callnewh(size) == 0)
{
// report no memory
// 如果申请内存失败了,这里会抛出bad_alloc 类型异常
static const std::bad_alloc nomem;
_RAISE(nomem);
}
return (p);
}
/*
operator delete: 该函数最终是通过free来释放空间的
*/
void operator delete(void *pUserData)
{
_CrtMemBlockHeader * pHead;
RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));
if (pUserData == NULL)
return;
_mlock(_HEAP_LOCK); /* block other threads */
__TRY
/* get a pointer to memory block header */
pHead = pHdr(pUserData);
/* verify block type */
_ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));
_free_dbg( pUserData, pHead->nBlockUse );
__FINALLY
_munlock(_HEAP_LOCK); /* release other threads */
__END_TRY_FINALLY
return;
}
/*
free的实现
*/
#define free(p) _free_dbg(p, _NORMAL_BLOCK)
通过上述两个全局函数的实现知道,operator new
实际也是通过malloc
来申请空间,如果malloc
申请空间成功就直接返回,否则执行用户提供的空间不足应对措施,如果用户提供该措施就继续申请,否则就抛异常。operator delete
最终是通过free
来释放空间的。
3.operator new/operator delete与malloc/free
operator new
和operator delete
是可以当成malloc
和free
用的。
int main()
{
Stack* pst = (Stack*)operator new(sizeof(Stack));
operator delete(pst);
return 0;
}
它们除了名字不一样,用法几乎一模一样,operator new
就是封装的malloc
。只不过malloc
开辟空间失败,直接返回NULL,和我们抛异常的需求不符,所以又有了operator new
。
5.new和delete的实现原理
1.内置类型
如果申请的是内置类型的空间,new
和malloc
,delete
和free
基本类似,不同的地方是:new
/delete
申请和释放的是单个元素的空间,new[]
和delete[]
申请的是连续空间,而且new
在申请空间失败时会抛异常,malloc
会返回NULL
。
int main()
{
int* p = new int[10];
// 调以下三个函数中任意一个,都没有问题
free(p);
delete p;
delete[] p;
return 0;
}
内置类型不会出什么大的问题,但接下来的自定义类型,就该出问题了。
2.自定义类型
1)new
的原理
- 调用
operator new
函数申请空间 - 在申请的空间上执行构造函数,完成对象的构造
2)delete
的原理
- 在空间上执行析构函数,完成对象中资源的清理工作
- 调用
operator delete
函数释放对象的空间
3)new T[N]
的原理
- 调用
operator new[]
函数,在operator new[]
中实际调用operator new
函数完成N个对象空间的申请 - 在申请的空间上执行N次构造函数
4)delete[]
的原理
- 在释放的对象空间上执行N次析构函数,完成N个对象中资源的清理
- 调用
operator delete[]
释放空间,实际在operator delete[]
中调用operator delete
来释放空间
3.研究自定义类型可能出现的问题:(测试环境VS2022)
不写析构函数:
class A
{
public:
A(int a = 0)
:_a1(a)
{}
private:
int _a1;
};
int main()
{
A* p = new A[10];
// 调以下三个函数中任意一个,都没有问题
free(p);
delete p;
delete[] p;
return 0;
}
写析构函数:
class A
{
public:
A(int a = 0)
:_a1(a)
{}
// 加上这个析构函数
~A()
{
cout << "~A()" << endl;
}
private:
int _a1;
};
int main()
{
A* p = new A[10];
//free(p); 报错
//delete p; 报错
delete[] p;
return 0;
}
这又是为什么?加上析构函数怎么就编不过了?
1)写了析构函数的情况:
new
会先开辟空间,然后再根据[]
中你传入的数据,调对应次数的构造函数。但是delete
释放空间时,我们的写法是delete[]
,并没有传入数据,那delete
又是怎么知道该调用几次析构函数的呢?来看内存空间示意图:
我们写A* p = new A[10];
(本实例类A的大小为4个字节),实际上开辟的空间是40+4=44
个字节,多开了4个字节的空间。这前4个字节中,存的数据是10,表示有10个A类。new
返回的指针指向图中箭头所指的位置,而delete[]
在释放空间时,会先让指针偏移,移到最左边,读取到10这个数据,然后又根据这个数据确定要调用几次析构函数,最后一口气释放44字节的空间。free(p);
和delete p;
报错的本质原因是指针的位置不对,没有偏移到最左边。
2)没有写析构函数的情况:
如果我们不写析构函数,就VS2022这个编译器来说,它会做一些优化,我们来看内存空间示意图:
既然我们没写析构函数,编译器默认生成的析构函数又不处理内置类型的数据,索性在new
空间时,就不多开那4个字节的空间,因为最后就没有调用析构函数的必要,此时指针的位置,正好就是第一个A类数据存储的位置。这时我们再使用free
,delete
,delete[]
中的任何一个,效果是一样的,因为指针的位置是正确的。
4.结论:
一定要匹配使用这几个操作符,不要作妖。
6.定位new表达式(placement-new) (了解)
定位new表达式是在已分配的原始内存空间中,调用构造函数初始化一个对象。
1.使用格式:
new (place_address) type
或者new (place_address) type(initializer-list)
。
place_address
必须是一个指针,initializer-list
是类型的初始化列表。
2.使用场景:
定位new表达式在实际中一般是配合内存池使用。因为内存池分配出的内存没有初始化,所以如果是自定义类型的对象,需要使用new的定义表达式进行显示调构造函数进行初始化。
这里简单介绍一下池化技术:
如果我们一需空间,就去找堆区开辟空间,这个过程的开销其实是挺大的。但是,如果我们提前把空间一次开好,想用的时候直接拿来用,就节省了在堆区频繁开辟空间的消耗。我们把这个提前开好的空间,称为内存池。
打个比方:
假如有一户人家住在离河边一个路口的距离,这户人家在需要用水的时候(比如做饭、洗衣服),用一次水,去河边打一次水,这样是不是很麻烦。这户人家就想了一个办法,一次性打够一缸的水,放在家中,想用的时候直接去缸里打水就好了。
class A
{
public:
A(int a = 0)
: _a(a)
{
cout << "A():" << this << endl;
}
~A()
{
cout << "~A():" << this << endl;
}
private:
int _a;
};
// 定位new/replacement new
int main()
{
// p1现在指向的只不过是与A对象相同大小的一段空间,还不能算是一个对象,因为构造函数没有执行
A* p1 = (A*)malloc(sizeof(A));
new(p1)A; // 注意:如果A类的构造函数有参数时,此处需要传参
p1->~A();
free(p1);
A* p2 = (A*)operator new(sizeof(A));
new(p2)A(10);
p2->~A();
operator delete(p2);
return 0;
}
7.malloc/free和new/delete的区别
malloc/free
和new/delete
的共同点是:都是从堆上申请空间,并且需要用户手动释放。不同的地方是:
malloc
和free
是函数,new
和delete
是操作符。malloc
申请的空间不会初始化,new
可以初始化。malloc
申请空间时,需要手动计算空间大小并传递,new
只需在其后跟上空间的类型即可,如果是多个对象,[]中指定对象个数即可。malloc
的返回值为void*
, 在使用时必须强转,new
不需要,因为new
后跟的是空间的类型。malloc
申请空间失败时,返回的是NULL
,因此使用时必须判空,new
不需要,但是new
需要捕获异常。- 申请自定义类型对象时,
malloc/free
只会开辟空间,不会调用构造函数与析构函数,而new
在申请空间后会调用构造函数完成对象的初始化,delete
在释放空间前会调用析构函数完成空间中资源的清理。
8.内存泄漏
8.1什么是内存泄漏,内存泄漏的危害
1.什么是内存泄漏:
内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对该段内存的控制,因而造成了内存的浪费。
2.内存泄漏的危害:
长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现内存泄漏会导致响应越来越慢,最终卡死。
3.例:
void MemoryLeaks()
{
// 1.内存申请了忘记释放
int* p1 = (int*)malloc(sizeof(int));
int* p2 = new int;
// 2.异常安全问题
int* p3 = new int[10];
Func(); // 这里Func函数抛异常导致 delete[] p3未执行,p3没被释放.
delete[] p3;
}
8.2内存泄漏分类(了解)
C/C++程序中一般我们关心两种方面的内存泄漏:
1.堆内存泄漏(Heap leak)
堆内存指的是程序执行中依据须要分配通过malloc
/calloc
/realloc
/new
等从堆中分配的一块内存,用完后必须通过调用相应的free
或者delete
删掉。假设程序的设计错误导致这部分内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。
2.系统资源泄漏
指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。
8.3如何检查内存泄漏(了解)
在vs下,可以使用windows操作系统提供的_CrtDumpMemoryLeaks()
函数进行简单检测,该函数只报出了大概泄漏了多少个字节,没有其他更准确的位置信息。
int main()
{
int* p = new int[10];
// 将该函数放在main函数之后,每次程序退出的时候就会检测是否存在内存泄漏
_CrtDumpMemoryLeaks();
return 0;
}
// 程序退出后,在输出窗口中可以检测到泄漏了多少字节,但是没有具体的位置
Detected memory leaks!
Dumping objects ->
{79} normal block at 0x00EC5FB8, 40 bytes long.
Data: < > CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD
Object dump complete.
因此写代码时一定要小心,尤其是动态内存操作时,一定要记着释放。但有些情况下总是防不胜防,简单的可以采用上述方式快速定位下。如果工程比较大,内存泄漏位置比较多,不太好查时一般都是借助第三方内存泄漏检测工具处理的。
8.4如何避免内存泄漏
1.工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps:这是个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要下一条智能指针来管理才有保证。
2.采用RAII思想或者智能指针来管理资源。
3.有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。
4.出问题了使用内存泄漏工具检测。ps:不过很多工具都不够靠谱,或者收费昂贵。
总结一下:
内存泄漏非常常见,解决方案分为两种:1、事前预防型。如智能指针等。2、事后查错型。如泄漏检测工具。