文章目录
智能指针
1. 为什么需要智能指针
下面我们先分析一下下面这段程序有没有什么内存方面的问题?提示一下:注意分析MergeSort函数中的问题。
int div()
{
int a, b;
cin >> a >> b;
if (b == 0)
throw invalid_argument("除0错误");
return a / b;
}
void Func()
{
// 1、如果p1这里new 抛异常会如何?
// 2、如果p2这里new 抛异常会如何?
// 3、如果div调用这里又会抛异常会如何?
int* p1 = new int;
int* p2 = new int;
cout << div() << endl;
delete p1;
delete p2;
}
int main()
{
try
{
Func();
}
catch (exception& e)
{
cout << e.what() << endl;
}
return 0;
}
首先上面的代码可能会存在内存泄露的问题:
- 若p1这里new 抛异常则不会存在问题,p1申请空间失败直接抛异常,不会继续向后申请p2空间也不会调用div函数
- 若p2这里new 抛异常,则会导致p1申请的空间未释放
- 若div调用这里抛异常,程序会直接跳到main函数中catch捕获的不会,则会导致p1, p2申请的空间未释放
我们用抛异常的方式来修改代码,处理内存泄露的问题
int div()
{
int a, b;
cin >> a >> b;
if (b == 0)
throw invalid_argument("除0错误");
return a / b;
}
void Func()
{
// 1、如果p1这里new 抛异常会如何?
// 2、如果p2这里new 抛异常会如何?
// 3、如果div调用这里又会抛异常会如何?
int* p1 = new int;
int* p2 = nullptr;
// 防止p2抛异常
try
{
p2 = new int;
}
catch (...)
{
delete p1;
throw;
}
// 防止div抛异常
try
{
cout << div() << endl;
}
catch (...)
{
delete p1;
delete p2;
throw;
}
delete p1;
delete p2;
}
int main()
{
try
{
Func();
}
catch (exception& e)
{
cout << e.what() << endl;
}
return 0;
}
添加两个try_catch语句修改后解决了内存泄露的问题,但是会让整个代码看起来繁琐,如果还有其他new变量还是需要添加try_catch语句,比较麻烦。下面我们就来学习以智能指针的方式来防止内存泄露。
2. 内存泄露
2.1 什么是内存泄漏,内存泄漏的危害
-
什么是内存泄漏:内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对该段内存的控制,因而造成了内存的浪费。
-
内存泄漏的危害:长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现内存泄漏会导致响应越来越慢,最终卡死。
2.2 内存泄漏分类(了解)
C/C++程序中一般我们关心两种方面的内存泄漏:
- 堆内存泄漏(Heap leak)
堆内存指的是程序执行中依据须要分配通过malloc / calloc / realloc / new等从堆中分配的一块内存,用完后必须通过调用相应的 free或者delete 删掉。假设程序的设计错误导致这部分内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。 - 系统资源泄漏
指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。
2.3 如何检测内存泄漏(了解)
-
在linux下内存泄漏检测: Linux下几款C++程序中的内存泄露检查工具_c++内存泄露工具分析-CSDN博客
-
在windows下使用第三方工具:VLD工具说明:VLD(Visual LeakDetector)内存泄露库-CSDN博客
-
其他工具:内存泄漏工具比较:内存泄露检测工具比较 - 默默淡然 - 博客园 (cnblogs.com)
2.4 如何避免内存泄漏
-
工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps:这个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要下一条智能指针来管理才有保证。
-
采用RAII思想或者智能指针来管理资源。
-
有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。
-
出问题了使用内存泄漏工具检测。ps:不过很多工具都不够靠谱,或者收费昂贵。
总结一下:
内存泄漏非常常见,解决方案分为两种:1、事前预防型。如智能指针等。2、事后查错型。如泄漏检测工具。
3. 智能指针的使用及原理
3.1 RAII
RAII(Resource Acquisition Is Initialization)是一种利用对象生命周期来控制程序资源(如内存、文件句柄、网络连接、互斥量等等)的简单技术。
在对象构造时获取资源,接着控制对资源的访问使之在对象的生命周期内始终保持有效,最后在对象析构的时候释放资源。借此,我们实际上把管理一份资源的责任托管给了一个对象。这种做法有两大好处:
-
不需要显式地释放资源。
-
采用这种方式,对象所需的资源在其生命期内始终保持有效
template<class T>
class SmartPtr
{
public:
SmartPtr(T*ptr)
:_ptr(ptr)
{
}
~SmartPtr()
{
// cout << "delete:" << _ptr << endl; // 用来检测是否被析构(实际不用写)
delete _ptr;
}
private:
T* _ptr;
};
int div()
{
int a, b;
cin >> a >> b;
if (b == 0)
throw invalid_argument("除0错误");
return a / b;
}
void Func()
{
SmartPtr<int> sp1(new int(1));
SmartPtr<int> sp2(new int(2));
cout << div() << endl;
}
int main()
{
try
{
Func();
}
catch (const exception&e)
{
cout << e.what() << endl;
}
return 0;
}
运行代码后发现:无论程序是否抛异常都能正确释放
3.2 智能指针的原理
上述的SmartPtr还不能将其称为智能指针,因为它还不具有指针的行为。指针可以解引用,也可以通过->去访问所指空间中的内容,因此:AutoPtr模板类中还得需要将* 、->重载下,才可让其像指针一样去使用。
template<class T>
class SmartPtr
{
public:
SmartPtr(T*ptr)
:_ptr(ptr)
{
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
~SmartPtr()
{
delete _ptr;
}
private:
T* _ptr;
};
总结一下智能指针的原理:
- RAII特性
- 重载operator*和opertaor->,具有像指针一样的行为
指针拷贝的问题:
让两个指针指向同一块资源,需要进行拷贝。不写拷贝构造函数,直接用默认生成的拷贝构造函数进行拷贝
会程序崩溃
默认生成拷贝构造函数完成了浅拷贝,让两个指针指向同一个资源,最后会析构两次,导致程序崩溃。
那我们那不能写成深拷贝呢?不能,因为sp1和sp2就是要指向同一个资源,即指针拷贝要的就是浅拷贝。
之前学过链表/红黑树等其他结构也是用浅拷贝,为什么没有问题呢?
- 迭代器不用管资源释放,资源释放是容器处理的
- 智能指针要管资源释放,所以不能单纯的浅拷贝
接下来就以C++库中智能指针为例学习,尝试解决指针拷贝的问题
3.3 std::auto_ptr
C++98版本的库中就提供了auto_ptr的智能指针。下面演示的auto_ptr的使用及问题。
auto_ptr的实现原理:管理权转移的思想,下面简化模拟实现了一份yj::auto_ptr来了解它的原理
namespace yj
{
template<class T>
class auto_ptr
{
public:
auto_ptr(T*ptr)
:_ptr(ptr)
{
}
// 管理权转移
auto_ptr(auto_ptr<T>&ap)
:_ptr(ap._ptr)
{
ap._ptr = nullptr;
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
~auto_ptr()
{
delete _ptr;
}
private:
T* _ptr;
};
}
我们写一段代码来运行调试观察:
一旦我们使用auto_ptr的拷贝构造函数,用sp1来拷贝sp2发现能够拷贝成功,但是拷贝之后sp1就会被悬空,此时我们一旦去解引用访问sp1时,程序会崩溃
结论:auto_ptr是一个失败设计,很多公司明确要求不能使用auto_ptr
3.4 std::unique_ptr
C++11中开始提供更靠谱的unique_ptr。
unique_ptr的实现原理:简单粗暴的防拷贝,下面简化模拟实现了一份unique_ptr来了解它的原理
namespace yj
{
template<class T>
class unique_ptr
{
public:
unique_ptr(T* ptr)
:_ptr(ptr)
{
}
// C++11:
unique_ptr(const unique_ptr<T>& up) = delete;
unique_ptr<T>& operator=(const unique_ptr<T>& up) = delete;
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
~unique_ptr()
{
delete _ptr;
}
private:
// C++98思路:
// 只声明不实现, 防止别人在外面强行定义, 直接声明为私有
//unique_ptr(const unique_ptr<T>& up);
//unique_ptr<T>& operator=(const unique_ptr<T>& up);
T* _ptr;
};
}
3.5 std::shared_ptr
C++11中开始提供更靠谱的并且支持拷贝的shared_ptr
shared_ptr的原理:是通过引用计数的方式来实现多个shared_ptr对象之间共享资源。例如:老师晚上在下班之前都会通知,让最后走的学生记得把门锁下。
- shared_ptr在其内部,给每个资源都维护了着一份计数,用来记录该份资源被几个对象共享。
- 在对象被销毁时(也就是析构函数调用),就说明自己不使用该资源了,对象的引用计数减一。
- 如果引用计数是0,就说明自己是最后一个使用该资源的对象,必须释放该资源;
- 如果不是0,就说明除了自己还有其他对象在使用该份资源,不能释放该资源,否则其他对象就成野指针了
那么如何设计这个引用计数呢:
- 直接搞一个int的成员变量,那么每个对象中都会有一个引用计数,无法被共享
- 搞一个static int的成员变量,也是不行的因为静态成员是属于所有对象的,多个对象可能需要多个资源,每个资源应该配对一个引用计数
- 设计成int* 的成员变量,每来一个智能指针想要指向时,就++引用计数;不想指向时就–引用计数,直至减到0进行释放。
template<class T>
class shared_ptr
{
public:
shared_ptr(T* ptr)
:_ptr(ptr)
, _pcount(new int(1))
{
}
shared_ptr(const shared_ptr<T>& sp)
:_ptr(sp._ptr)
, _pcount(sp._pcount)
{
++(*_pcount);
}
// p1 = p4
shared_ptr<T>& operator=(const shared_ptr<T>& sp)
{
if (_ptr != sp._ptr) // 防止自己给自己赋值
{
if (--(*_pcount) == 0)
{
delete _pcount;
delete _ptr;
}
_ptr = sp._ptr;
_pcount = sp._pcount;
++(*sp._pcount);
}
return *this;
}
~shared_ptr()
{
if (--(*_pcount) == 0)
{
cout << "delete:" << _ptr << endl;
delete _pcount;
delete _ptr;
}
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
T* get()
{
return _ptr;
}
int use_count()
{
return *_pcount;
}
private:
T* _ptr;
int* _pcount;
};
重点实现好拷贝构造函数和赋值重载函数。
完成后,进行简单测试:
测试正确,那我们智能指针第一个小实现没有问题。下面我们来完善shared_ptr。
(1) std::shared_ptr的线程安全问题
通过下面的程序我们来测试shared_ptr的线程安全问题。需要注意的是shared_ptr的线程安全分为两方面:
- 智能指针对象中引用计数是多个智能指针对象共享的,两个线程中智能指针的引用计数同时++或–,这个操作不是原子的,引用计数原来是1,++了两次,可能还是2.这样引用计数就错乱了。会导致资源未释放或者程序崩溃的问题。所以智能指针中引用计数++、–是需要加锁的,也就是说引用计数的操作是线程安全的。
- 智能指针管理的对象存放在堆上,两个线程中同时去访问,会导致线程安全问题。
写一个小demo对我们自己实现的智能指针进行线程安全测试
struct Date
{
int _year = 0;
int _month = 0;
int _day = 0;
~Date()
{
}
};
void SharePtrFunc(yj::shared_ptr<Date>& sp, size_t n, mutex& mtx)
{
cout << sp.get() << endl;
for (size_t i = 0; i < n; ++i)
{
// 这里智能指针拷贝会++计数,智能指针析构会--计数,这里是线程安全的。
yj::shared_ptr<Date> copy(sp);
// 智能指针本身是线程安全的, 它管理的对象要通过加锁保证线程安全
mtx.lock();
sp->_year++;
sp->_day++;
sp->_month++;
mtx.unlock();
}
}
void test_shared_safe()
{
yj::shared_ptr<Date> p(new Date);
cout << p.get() << endl;
const size_t n = 10000;
mutex mtx;
thread t1(SharePtrFunc, ref(p), n, ref(mtx));
thread t2(SharePtrFunc, ref(p), n, ref(mtx));
t1.join();
t2.join();
cout << p.use_count() << endl;
}
运行代码后,观察最终引用计数是否为1来判断。可能会出现3种情况:
- 最后的引用计数是1没有问题
- 两个智能指针同时对引用计数++,最后结果变大
- 两个智能指针同时对引用–,引用计数变小导致提前释放,程序崩溃。
(2) 引用计数加锁保护
所以我们要给智能指针中的引用计数±操作进行加锁保护
namespace yj
{
template<class T>
class shared_ptr
{
public:
shared_ptr(T* ptr=nullptr)
:_ptr(ptr)
,_pcount(new int(1))
,_pmtx(new mutex)
{
}
void Addcount()
{
_pmtx->lock();
++(*_pcount);
_pmtx->unlock();
}
void Release()
{
_pmtx->lock();
bool deleteFlag = false;
if (--(*_pcount) == 0)
{
//cout << "delete:" << _ptr << endl;
delete _pcount;
delete _ptr;
deleteFlag = true;
}
// 解决锁释放的问题
_pmtx->unlock();
if (deleteFlag)
{
delete _pmtx;
}
}
shared_ptr(const shared_ptr<T>& sp)
:_ptr(sp._ptr)
,_pcount(sp._pcount)
,_pmtx(sp._pmtx)
{
Addcount();
}
// p1 = p4
shared_ptr<T>& operator=(const shared_ptr<T>& sp)
{
if (_ptr != sp._ptr) // 防止自己给自己赋值
{
Release();
_ptr = sp._ptr;
_pcount = sp._pcount;
_pmtx = sp._pmtx;
Addcount();
}
return *this;
}
~shared_ptr()
{
Release();
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
T* get()const
{
return _ptr;
}
int use_count()
{
return *_pcount;
}
private:
T* _ptr;
int* _pcount;
mutex* _pmtx; // 锁也得是指针, 多个智能指针是同一把锁
};
}
加锁后,在上面demo代码中两个智能指针对日期操作时也要加锁保护,才能保证线程安全
总结: shared_ptr智能指针本身是线程安全的, 它管理的对象要通过加锁保证线程安全
(3) std::shared_ptr的循环引用
以一个双向链表为例:
struct ListNode
{
yj::shared_ptr<ListNode> _next;
yj::shared_ptr<ListNode> _prev;
~ListNode()
{
cout << "~ListNode()" << endl;
}
};
void test_shared_cycle()
{
yj::shared_ptr<ListNode> n1(new ListNode);
yj::shared_ptr<ListNode> n2(new ListNode);
n1->_next = n2;
n2->_prev = n1;
}
上面的代码,运行起来后不能正确析构。
循环引用分析:
-
n1
和n2
两个智能指针对象指向两个节点,引用计数变成1,我们不需要手动delete
。 -
n1
的_next
指向n2
,n2
的_prev
指向n1
,引用计数变成2。 -
n1
和n2
析构,引用计数减到1,但是_next
还指向下一个节点。但是_prev
还指向上一个节点。 -
也就是说
_next
析构了,n2就释放了。 -
也就是说
_prev
析构了,n1
就释放了。 -
但是
_next
属于node的成员,n1
释放了,_next
才会析构,而n1
由_prev
管理,_prev
属于n2
成员,所以这就叫循环引用,谁也不会释放。
分析过程:
(4) std::weak_ptr
库里的解决方案是用weak_ptr来解决循环引用问题,核心是:weak_ptr可以指向资源,但是它不参与管理,不增加引用计数
模拟实现weak_ptr:
namespace yj
{
template<class T>
class weak_ptr
{
public:
weak_ptr()
:_ptr(nullptr)
{
}
// 支持用shared_ptr来拷贝构造weak_ptr
weak_ptr(const shared_ptr<T>& sp)
:_ptr(sp.get())
{
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
T* get()
{
return _ptr;
}
private:
T* _ptr;
};
}
实现后,将上面循环引用的代码修改,使用weak_ptr来管理两个ListNode节点,就不会出现问题
struct ListNode
{
yj::weak_ptr<ListNode> _next;
yj::weak_ptr<ListNode> _prev;
~ListNode()
{
cout << "~ListNode()" << endl;
}
};
void test_shared_cycle()
{
yj::shared_ptr<ListNode> n1(new ListNode);
yj::shared_ptr<ListNode> n2(new ListNode);
n1->_next = n2;
n2->_prev = n1;
}
测试后,发现能够正确释放
4. 智能指针的定制删除器(了解)
上面我们已经解决了智能指针大部分问题,下面来分析,对象若不是new出来的,是new []或其他的该如何解决。
上面的代码只能搞定new的单个对象,其他类型无法正确释放。结合之前仿函数和lambda知识,我们在使用智能指针时可以传入一个可调用对象,来专门解决删除问题。可调用对象可以是:函数指针,仿函数,lambda。同时要修改我们上面模拟实现的shared_ptr,定义_del的对象,采用包装器包装lambda表达式。给出相对应的构造函数,结合我们调用时传入的可调用对象配合使用。
改造后的智能指针:
namespace lyh
{
template<class T>
class shared_ptr
{
public:
shared_ptr(T* ptr = nullptr)
:_ptr(ptr)
, _pcount(new int(1))
, _pmtx(new mutex)
{
}
template<class D>
shared_ptr(T* ptr, D del)
:_ptr(ptr)
, _pcount(new int(1))
, _pmtx(new mutex)
,_del(del)
{
}
void Addcount()
{
_pmtx->lock();
++(*_pcount);
_pmtx->unlock();
}
void Release()
{
_pmtx->lock();
bool deleteFlag = false;
if (--(*_pcount) == 0)
{
//cout << "delete:" << _ptr << endl;
delete _pcount;
//delete _ptr;
_del(_ptr);
deleteFlag = true;
}
// 解决锁释放的问题
_pmtx->unlock();
if (deleteFlag)
{
delete _pmtx;
}
}
shared_ptr(const shared_ptr<T>& sp)
:_ptr(sp._ptr)
, _pcount(sp._pcount)
, _pmtx(sp._pmtx)
{
Addcount();
}
// p1 = p4
shared_ptr<T>& operator=(const shared_ptr<T>& sp)
{
if (_ptr != sp._ptr) // 防止自己给自己赋值
{
Release();
_ptr = sp._ptr;
_pcount = sp._pcount;
_pmtx = sp._pmtx;
Addcount();
}
return *this;
}
~shared_ptr()
{
Release();
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
T* get()const
{
return _ptr;
}
int use_count()
{
return *_pcount;
}
private:
T* _ptr;
int* _pcount;
mutex* _pmtx;
// 包装器
function<void(T*)> _del= [](T* ptr) {
cout << "lambda delete: " <<ptr<< endl;
delete ptr;
};
};
}
namespace lyh
{
template<class T>
class weak_ptr
{
public:
weak_ptr()
:_ptr(nullptr)
{
}
weak_ptr(const shared_ptr<T>& sp)
:_ptr(sp.get())
{
}
T& operator*()
{
return *_ptr;
}
T* operator->()
{
return _ptr;
}
T* get()
{
return _ptr;
}
private:
T* _ptr;
};
}
测试:
struct Date
{
int _year = 0;
int _month = 0;
int _day = 0;
~Date()
{
}
};
template<class T>
struct DeleteArray
{
void operator()(T* ptr)
{
cout << "void operator()(T* ptr)" << endl;
delete[] ptr;
}
};
void test_shared_deletor()
{
lyh::shared_ptr<Date> sp0(new Date);
lyh::shared_ptr<Date> spa1(new Date[10], DeleteArray<Date>());
lyh::shared_ptr<Date> spa2(new Date[12], [](Date* ptr) {
cout << "lambda delete[]: " << endl;
delete[] ptr;
});
lyh::shared_ptr<FILE> sp3(fopen("test.cpp", "r"), [](FILE* ptr) {
cout << "lambda fclose: " << ptr << endl;
fclose(ptr);
});
}
运行结果:
5. C++11和boost中智能指针的关系
- C++ 98 中产生了第一个智能指针
auto_ptr
。 - C++ boost给出了更实用的
scoped_ptr
和shared_ptr
和weak_ptr
- C++ TR1,引入了
shared_ptr
等。不过注意的是TR1并不是标准版。 - C++ 11,引入了
unique_ptr
和shared_ptr
和weak_ptr
。需要注意的是unique_ptr
对应boost的scoped _ptr
。并且这些智能指针的实现原理是参考boost中的实现的。