RVO (return value optimization) 和NRVO (named return value optimization) 是C++在处理一个函数返回类对象并将返回值赋给另一个对象时,为了减少拷贝构造次数以及析构次数而采用的一种编译器优化技术。
本篇博客以《深度探索C++对象模型》中例子来总结这两种优化技术。代码片段如下:
class Point3d
{
public:
int m_x;
int m_y;
int m_z;
public:
Point3d(int x,int y,int z):m_x(x),m_y(y),m_z(z)
{
cout << "constructor"<<endl;
}
~Point3d()
{
cout << "deconstructor"<<endl;
}
Point3d(const Ponint3d &other)
{
this.m_x = other.m_x;
this.m_y = other.m_y;
this.m_z = other.m_z;
cout << "copy constructor"<<endl;
}
Point3d &operator=(const Point3d &other)
{
if(this != &other)
{
this.m_x = other.m_x;
this.m_y = other.m_y;
this.m_z = other.m_z;
}
cout << "operator="<<endl;
return *this;
}
}
Point3d factory()
{
Point3d po(1,2,3)
return po;
}
int main()
{
Point3d p = factory();
return 1;
}
这个例子中的Point3d类中显式定义了构造函数、拷贝构造函数、析构函数以及重载了赋值运算符,并在内部加入了一些打印信息来查看这些函数的调用情况。
1)不做任何返回值优化。在g++中有一个选项-fno-elide-constructors可以去掉任何返回值优化。最终打印情况如下:
constructor //factory函数中构造po对象
copy constructor //factory函数中用po对象拷贝构造临时对象_temp
deconstructor //factory函数中返回时,析构掉局部对象po
copy constructor //main函数中用factory函数中拷贝构造的临时对象拷贝构造对象p
deconstructor //析构临时对象_temp
deconstructor //main函数结束时,析构对象p
可以看出,不做任何优化的话就是有两次拷贝构造和析构,对照注释很容易理解
2)做RVO优化,VS在debug模式下使用RVO而不用NRVO。对应的输出如下:
constructor
copy constructor
deconstructor
deconstructor //main函数中p的析构
在《在深度探索C++对象模型》书中,对应的解释为,编译器将factor函数改写为了如下的伪代码形式:
factory(const Point3d &_result)
{
Point3d po;
po.Point3d::Point3d(1,2,3);
_result.Point3d::Point3d(po); //用po拷贝构造_result;
po.Point3d::~Point3d(); //po对象析构
return;
}
而main函数中赋值语句改写为:
Point3d p;
factory(p);
这样将p直接做为参数,在factory()函数中进行构造,就不需要先将po拷贝构造出临时对象_temp,再析构_temp。
3)那能不能直接构造p,而不需要先构造po,再拷贝构造p呢。答案是可以的,需要将factory()函数改写为如下形式:
factor()
{
return Point3d(1,2,3);
}
这种返回临时对象的写法,如果开启了编译器的RVO优化,factory()函数的大致伪代码实现就会改写为:
factory(const Point3d &_result)
{
_result.Point3d::Point3d(1,2,3); //直接将p作为参数构造
return;
}
相应的打印情况,就为:
constructor //p的构造
deconstructor //p的析构
这样将拷贝构造函数和析构函数又减少了一次。
4)有时程序员会不注意将factory()函数改写为(3)中的形式,那能不能不改写也能起到(3)中的优化效果呢,这时NRVO优化就上场了。
如果程序员还是将factory()函数写成:
Point3d factory()
{
Point3d po(1,2,3)
return po;
}
有了NRVO优化编译器还是会将其优化成(3)中的形式,对应输出结果当然同样只有一次构造和析构。
我在vs下和gcc下分别在debug模式和release模式下验证发现,gcc在debug和release模式下都支持NRVO优化,在vs的debug模式下只支持RVO优化,release模式下支持NRVO优化。对于其它的编译器,还暂时没做相应的验证。