Named Return Value Optimization 具名返回值优化

最新推荐文章于 2024-08-10 18:16:07 发布

lfw19891101

最新推荐文章于 2024-08-10 18:16:07 发布

阅读量1.3k

点赞数

文章标签： optimization 优化 constructor 编译器 iostream delete

问题描述 :

当一个函数返回一个对象的实例，一个临时对象被创建并通过拷贝构造函数传回其值。 C++ 标准允许省略拷贝构造函数的对象（即使会导致程序结果的不一致）。

前提是所有的路径返回相同的对象。

问题由来：
看如下的函数：

X bar() {

X xx;

//… 处理 xx

return xx;

}

如果看到了这篇文章，大概应该知道编译期面对这个函数会做如下的转化：

//Pseudo C++ Code

void bar( X &__result ) {

X xx;

xx.X::X(); //default constructor

// .. 处理 xx

__result.X::X( xx ); // copy constructor

return;

}

如上述 bar() 这样，所有的路径都返回相同的具名数值 (Named Value) ，因此编译器可以做自己的优化。以 __result 取代 Named Return Valued 。

//Pseudo C++ Code

void bar( X &__result ) {

__result.X::X(); //default constructor

// .. 处理 xx

return;

}

编译器呢？

B.Lippman 的 Inside the C++ Object Model 一书中如是说 :

NRV 优化如今被视为标准 C++ 编译器的一个义不容辞的优化操作。真的如此吗？

其实 Visual C++ 熬到了 8.0 才支持了 Named Return Value Optimization 。

实际的例子：

以下例子均是在 VS2010 beta2 中测得。

#include <ctime>

#include <memory>

#include <iostream>

using namespace std ;

class test {

friend test foo ( double );

public :

test () {

memset ( array , 0 , 100 *sizeof ( double ) );

cout << "test constructor " << '/n' ;

}

~test () {

cout << "test deconstructor " << '/n' ;

}

test ( const test &t );

private :

double array [ 100 ];

};

inline

test ::test ( const test &t ) {

memcpy ( this , &t , sizeof ( test ) );

cout << "test copy " << '/n' ;

}

test foo ( double val ) {

test local , local2 ;

local .array [ 0 ] = val ;

local .array [ 99 ] = val ;

if (val > -1 )

return local ;

}

int main() {

test t1 = foo( 2 );

return 0;

}

在没有 NRVO 优化的时候，编译优化选项关闭 (cl /Od) ，得到

test constructor

test copy

test deconstructor

在打开 NRVO 优化时， (cl /O2) ，得到

test constructor

test deconstructor

可以看到，恰好是少了一次局部对象 xx 到 __result 的拷贝，以及析构。

注意的地方：

B.Lippman 在书中说到， NRVO 要由 Copy Constructor 激活，实际上不是的，至少 MS 在 VC 中没有这样做。

注释掉上述拷贝构造函数， NRVO 依然可进行。实际上注释掉之后编译器会产生一个版本（ bitwise copy ），可以从结果的两次构造，三次析构中看出来，少了的那次就是默认拷贝构造函数的调用。实行了优化后可见到只有两次析构的调用了，说明没有了默认拷贝构造函数的调用，编译器甚至不用产生它（需求时才产生）。

事实上，即使是没有定义拷贝构造函数和析构函数，而是有编译器产生（在需要时）， NRVO 依然会对程序的效率产生影响。如此能否说明 cfront 中以是否存在拷贝构造作为 NRVO 的开关存在争议？

首先注释调拷贝构造函数和析构函数，并在上述代码中增加：

friend test foo2 ( double );

test foo2 ( double val ) {

test local , local2 ;

local .array [ 0 ] = val ;

local .array [ 99 ] = val ;

if (val > -1 )

return local ;

return local2 ; //return 了不同的对象，编译器傻眼了 ^_^ ，不能 NVRO

}

注释调函数中的 cout 那些行，并重写 main 函数如下：