C++中的拷贝构造函数和深浅拷贝
一丶 拷贝构造函数
I. 引入
拷贝构造函数:只有单个形参,该形参是对本类型对象的引用(一般常用const修饰),在用已存在的类类型对象创建新的对象时由编译器自动调用。
这里我们以一个类Date举例,编写它的构造函数:
#include <iostream>
using namespace std;
class Date
{
public:
//自定义的全缺省型默认构造函数
Date(int day = 1, int month = 12, int year = 2024)
{
_day = day;
_month = month;
_year = year;
}
//自定义编写的拷贝构造函数
Date(const Date& date)
{
cout << "Date& date" << endl;
_day = date._day;
_month = date._month;
_year = date._year;
}
private:
int _day = 1;
int _month = 1;
int _year = 1;
};
拷贝构造函数的格式是这样的:
Date(const Date& date)
{
cout << "Date& date" << endl;
_day = date._day;
_month = date._month;
_year = date._year;
}
这里要先说明一下:在自定义类型本身作为形参类型时,传递值会调用该类类型的拷贝构造函数。在内部它通过该类类型的拷贝构造函数生成一个临时对象,再将该对象传递给形参。
因为这个原因,它必须接受引用值作为形参来创建本身的拷贝构造函数,这个具体原因在下面。
这个过程跟进行运算时生成临时对象很相似。
1.当自定义类型本身作为形参类型时,传递值会调用该类类型的拷贝构造函数。
2.当自定义类型的引用作为形参类型时,传递值不会调用该类类型的拷贝构造函数。
3.当自定义类型的指针作为形参类型时,传递值不会调用该类类型的拷贝构造函数。
#include <iostream>
using namespace std;
class Date
{
public:
Date(int day = 1, int month = 12, int year = 2024)
{
_day = day;
_month = month;
_year = year;
}
Date(const Date& date)
{
cout << "Date& date" << endl;
_day = date._day;
_month = date._month;
_year = date._year;
}
void Print()
{
cout << _year << "-" << _month << "-" << _day << endl;
}
private:
//这里是设置缺省值 不是定义
//此处对象未生成,不存在定义一说
int _day = 1;
int _month = 1;
int _year = 1;
};
void func(Date d)
{
d.Print();
}
void funcA(Date& d)
{
d.Print();
}
void funcB(Date* d)
{
d->Print();
}
int main()
{
Date d1;
func(d1); //调用拷贝构造
funcA(d1); //不调用拷贝构造
funcB(&d1); //不调用拷贝构造
return 0;
}
可以进入VS的调式进行观察,使用自定义类型的指针或者引用时,不需要再通过调用拷贝构造函数来传参了。
这里有一个小细节。在隐式调用拷贝构造函数时,会先利用缺省值来初始化创建对象,而后再进入拷贝构造函数。
在创建对象时,如果有缺省值,都会先用缺省值来初始化对象,如果构造函数中有值来初始化,那么就会覆盖该缺省值。无论是拷贝构造还是普通构造,它的内部都是这样的顺序。
II. 编写形式
类类型(const 类类型& 形参名称)
形如上面的Date类的拷贝构造函数:
Date(const Date& date)
{
cout << "Date& date" << endl;
_day = date._day;
_month = date._month;
_year = date._year;
}
为什么这里是const属性的形参呢?
这里来解释一下。首先无论实参是否为const属性,传入到拷贝构造中,都没有负面影响:对于const属性的实参来说,本身是平级传递;对于非const属性的实参来说,传递过程属于权限的缩小(由非const属性的可读可写临时转变为const属性的可读),语法是允许权限缩小的,因此也没影响。
那么重点来了,如果我们设置const属性,而是普通的变量属性(去掉const),那么在该拷贝构造函数内部就有权限更改原有对象了,这个会影响安全性,不是我们想要的结果,我们的目的是通过该对象生成一个一摸一样的对象,而不是更改原有的对象。
于是设置成const属性。
III. 特性
拷贝构造函数是特殊的类成员函数,有如下特征:
1. 拷贝构造函数是构造函数的一个重载形式。
拷贝构造函数是构造函数的一个重载形式。
也就是说,普通的构造函数,无论是默认的还是其他,与拷贝构造函数,只能选取其一进行初始化对象。因为拷贝构造函数本身是构造函数,属于重载。
2. 拷贝构造函数的参数只有一个而且必须是类类型对象的引用,使用传值的方式时编译器将直接报错,因为会引发无穷递归调用
拷贝构造函数的参数只有一个而且必须是类类型对象的引用,使用传值的方式时编译器将直接报错,因为会引发无穷递归调用。
class Date
{
public:
Date(int year = 1900, int month = 1, int day = 1)
{
_year = year;
_month = month;
_day = day;
}
// Date(const Date& d) // 正确写法
Date(const Date d) // 错误写法:编译报错,会引发无穷递归
{
_year = d._year;
_month = d._month;
_day = d._day;
}
private:
int _year;
int _month;
int _day;
};
int main()
{
Date d1;
Date d2(d1);
return 0;
}
它是如何引发无限递归呢?看一张图应该就清晰明了了。
若写成Date(const Date date)这样的形式,首先它就不构成拷贝构造了,它成为了普通的构造函数,那么在Date d2(d1)时会调用符合特征标的构造函数,自然对接Date(const Date date)。我们在上面提过,在自定义类型本身作为形参类型时,传递值会调用该类类型的拷贝构造函数。就也是说在代码走到Date(const Date date)这一行的时候,还得先调用拷贝构造函数,但是我们没有创建正确的拷贝构造函数,于是它就会不断地调用寻找拷贝构造,就如上图,因为根本没有拷贝构造函数,而内部要求它不断寻找,不断地调用符合特征标的函数,就形成了无限的递归调用。
3. 若未显式定义,编译器会生成默认的拷贝构造函数。
默认的拷贝构造函数对象按内存存储字节序完成拷贝,这种拷贝叫做浅拷贝,或者值拷贝。
浅拷贝可以理解为单纯地进行值的复制(在下面会详细举例)。
#include <iostream>
using namespace std;
class Time
{
public:
Time()
{
_hour = 1;
_minute = 1;
_second = 1;
}
Time(const Time& t)
{
_hour = t._hour;
_minute = t._minute;
_second = t._second;
cout << "Time::Time(const Time&)" << endl;
}
private:
int _hour;
int _minute;
int _second;
};
class Date
{
private:
// 基本类型(内置类型)
int _year = 1970;
int _month = 1;
int _day = 1;
// 自定义类型
Time _t;
};
int main()
{
Date d1;
// 用已经存在的d1拷贝构造d2,此处会调用Date类的拷贝构造函数
// 但Date类并没有显式定义拷贝构造函数,则编译器会给Date类生成一个默认的拷贝构造函数
Date d2(d1);
return 0;
}
注意:在编译器生成的默认拷贝构造函数中,内置类型是按照字节方式进行直接拷贝的,而自定义类型是调用其拷贝构造函数完成拷贝的。
4. 编译器生成的默认拷贝构造函数已经可以完成字节序的值拷
类中如果没有涉及资源申请,拷贝构造函数是否自行编写都可以;一旦涉及到资源申请时,则拷贝构造函数是一定要写的,否则就是浅拷贝。
浅拷贝有时会带来不好的问题,比如内存的重复释放。
5. 拷贝构造函数典型的调用场景:
- 使用已存在对象创建新对象
- 函数参数类型为类类型对象
- 函数返回值类型为类类型对象
使用已存在对象创建新对象,以及 函数参数类型为类类型对象,这两种情况在上面的例子中都有体现,这里我们说一下第三种情况:函数返回值类型为类类型对象时。
#include <iostream>
using namespace std;
class Date
{
public:
Date(int year, int minute, int day)
{
cout << "Date(int,int,int):" << this << endl;
}
Date(const Date& d)
{
cout << "Date(const Date& d):" << this << endl;
}
~Date()
{
cout << "~Date():" << this << endl;
}
private:
int _year;
int _month;
int _day;
};
//函数返回值类型为类类型对象
Date Test(Date d)
{
Date temp(d);
//返回类类型对象
return temp;
}
int main()
{
Date d1(2022, 1, 13);
Test(d1);
return 0;
}
这里要先讲一下不同的对象在调用各自的构造以及析构时的时机。它们遵循“先构造的后析构,后构造的先析构”的原则。函数调用建立栈帧,析构和构造也是同理,它们依然遵循栈的机制,确保先构造生成的对象不会在后续操作时已经被析构了,它一定要后面才析构。
上述代码中d1先调用构造,代码继续执行,至Test(d1)调用函数,进入函数体内部;执行代码Date temp(d)时将调用拷贝构造生成temp,此后return temp作为返回值会通过拷贝构造函数生成一个临时对象进行返回。
捋一下目前的构造:d1普通构造->形参d对象生成要调用拷贝构造->temp拷贝构造->return temp拷贝构造生成的临时对象;
析构正好是反过来:return temp拷贝构造生成的临时对象析构->temp析构->形参d对象析构->d1析构。
这里return temp的临时对象在构造和析构的时候被编译器优化掉了,不会显示出来。但从语法的角度讲,这里一共是进行了四个对象的四次析构和构造。
注意:为了提高程序效率,一般对象传参时,尽量使用引用类型,返回时根据实际场景,能用引用尽量使用引用。
二丶浅拷贝和深拷贝
I. 浅拷贝
默认的拷贝构造函数对象按内存存储字节序完成拷贝,这种拷贝叫做浅拷贝,或者值拷贝。
我们说浅拷贝可以理解为单纯地进行值的复制拷贝。
下面代码将展示浅拷贝可能发生的问题:
#include <iostream>
using namespace std;
typedef int DataType;
class Stack
{
public:
Stack(size_t capacity = 10)
{
_array = (DataType*)malloc(capacity * sizeof(DataType));
if (nullptr == _array)
{
perror("malloc申请空间失败");
return;
}
_size = 0;
_capacity = capacity;
}
void Push(const DataType& data)
{
// CheckCapacity();
_array[_size] = data;
_size++;
}
~Stack()
{
if (_array)
{
free(_array);
_array = nullptr;
_capacity = 0;
_size = 0;
}
}
private:
DataType* _array;
size_t _size;
size_t _capacity;
};
int main()
{
Stack s1;
s1.Push(1);
s1.Push(2);
s1.Push(3);
s1.Push(4);
Stack s2(s1);
return 0;
}
执行结果:
上述代码将发生运行时错误,我们直接说报错原因:内存重复释放。
栈s1进行push了4个值,这四个值是我们进行动态开辟内存获得空间来存储的。之后我们将s1的值利用拷贝构造赋值给栈s2,此时由于是编译器自行生成的拷贝构造函数,那么它进行的是浅拷贝,浅拷贝单纯地进行值的复制拷贝,进行s2._array = s1._array; s2._size = s1._size; s2._capacity =- s1._capacity;这样的操作。
在这里的s2._array = s1._array是进行了指针值的复制传递,但是,仅仅是复制了指针的值,此时s1的_array和s2的_array是指向同一块空间的,那么最后程序结束前调用析构,析构中要free(_array),s1和s2都进行同一块内存空间的内存释放,这就造成了内存重复释放。
不难看出,浅拷贝这个问题主要是由于多个指针指向同一块内存资源,导致在资源管理的时候多次释放。想解决这个问题,就需要进行深拷贝。
II. 深拷贝
深拷贝不仅进行值的拷贝,还将指针指向的内存也进行拷贝。
对于进行深拷贝的操作,我们拿Stack进行举例,假如它在拷贝构造函数中实现了深拷贝操作,那么在利用拷贝构造函数创建新对象的时候,_size,_capacity的值会被拷贝进新的对象中,同时,_array指向的内存被拷贝入新对象中,而不是指针_array值的传递。而新对象接受_array指向的内存的空间的开辟是由深拷贝操作完成的,深拷贝操作不仅进行值的拷贝,还将为指针类型开辟内存空间,为原对象指针指向的内存空间进行拷贝操作。
下面代码Stack中的拷贝构造函数实现深拷贝的操作:
#include <iostream>
using namespace std;
typedef int DataType;
class Stack
{
public:
Stack(size_t capacity = 10)
{
_array = (DataType*)malloc(capacity * sizeof(DataType));
if (nullptr == _array)
{
perror("malloc申请空间失败");
return;
}
_size = 0;
_capacity = capacity;
}
//深拷贝
//为新对象的指针指向的内存开辟新的空间 并将原对象的内存拷贝进新对象开辟的内存空间中
Stack(const Stack& st)
{
_array = (DataType*)malloc(st._capacity * sizeof(DataType));
if (nullptr == _array)
{
perror("malloc申请空间失败");
return;
}
memcpy(_array, st._array, sizeof(DataType) * st._size);
_size = st._size;
_capacity = st._capacity;
}
void Push(const DataType& data)
{
// CheckCapacity();
_array[_size] = data;
_size++;
}
~Stack()
{
if (_array)
{
free(_array);
_array = nullptr;
_capacity = 0;
_size = 0;
}
}
private:
DataType* _array;
size_t _size;
size_t _capacity;
};
int main()
{
Stack s1;
s1.Push(1);
s1.Push(2);
s1.Push(3);
s1.Push(4);
Stack s2(s1);
return 0;
}
进行深拷贝后,代码可以正常运行。
深拷贝完成了应该做到的资源管理,确保了每一个指针都独立维护属于自己的内存,因此不会出现同一块内存被重复释放的情况。
本博客仅供个人参考,如有错误请多多包含。
Aruinsches-C++日志-4/13/2024