左值引用的限制

最新推荐文章于 2024-03-14 15:16:55 发布

东方匠心

最新推荐文章于 2024-03-14 15:16:55 发布

阅读量724

点赞数

分类专栏：Ｃ++ 文章标签： vector constructor string reference 编译器 destructor

Ｃ++ 专栏收录该内容

55 篇文章 0 订阅

订阅专栏

C++0x, rvalue reference, move semantics, RVO, NRVO — 我们到底要什么收藏此文于2010-05-25被推荐到CSDN首页如何被推荐？ Visual C++ 2010 (VC10) 实现了一些颇有用处的 C++0x 新特性，其中就包括（万众期待的）rvalue reference 。本文不打算详述 rvalue reference 是什么了，关于这方面的文章已经不少，读者可以自己搜索来看看。我要说的是，今天我做了一些非常简单的关于 rvalue reference 的性能测试，其中有非常鼓舞人心的部分，也有 C++ 一以贯之的复杂和越来越复杂的部分。好消息：性能的极大提升从原理上讲，rvalue reference 使得 move semantics 成为可能，从而让编译器可以从rvalue对象中“偷走”资源，而不是拷贝数据，在很多情况下，这会带来性能的极大提升。测试代码很简单：比较 copy 和 move 一个 vector 对象的时间： view plaincopy to clipboardprint? 1. #include 2. #include 3. #include 4. #include 5. using namespace std; 6. vector make_vector() 7. { 8. vector v(1, string("this is a string")); 9. return v; 10. } 11. int main() 12. { 13. vector src(make_vector()), s(make_vector()); 14. clock_t start, end; 15. start = clock(); 16. for (int i = 0; i < 1000000; ++i) 17. { 18. vector s = src; 19. } 20. end = clock(); 21. cout << "Vector copy ctor takes: " << end - start << endl; 22. start = clock(); 23. for (int i = 0; i < 1000000; ++i) 24. { 25. vector s = move(src); 26. } 27. end = clock(); 28. cout << "Vector move ctor takes: " << end - start << endl; 29. return 0; 30. } #include #include #include #include using namespace std; vector make_vector() { vector v(1, string("this is a string")); return v; } int main() { vector src(make_vector()), s(make_vector()); clock_t start, end; start = clock(); for (int i = 0; i < 1000000; ++i) { vector s = src; } end = clock(); cout << "Vector copy ctor takes: " << end - start << endl; start = clock(); for (int i = 0; i < 1000000; ++i) { vector s = move(src); } end = clock(); cout << "Vector move ctor takes: " << end - start << endl; return 0; } 在我的相当老旧的笔记本上，Release 版本的输入是这样的 Vector copy ctor takes: 4562 Vector move ctor takes: 4 看来相当鼓舞人心不是？对于一个还不是太大太复杂的对象，move 比 copy 竟然能有千倍的性能提高！如果把 vector 的尺寸加大，move 版本的执行时间并不会有多大区别，而 copy 版本的执行时间则会随对象增大而延长。我们以后写一个函数来构造对象时，再也不需要使用丑陋的类似 view plaincopy to clipboardprint? 1. void make_vector(vector& out) void make_vector(vector& out) 之类的办法来避免对象拷贝，我们只需要在返回点或者调用点加上 move ！好吧，如果够细心，你会发现上面的代码玩了个花招：它没有在循环中调用 make_vector ，它只是把值保存起来，然后采用 copy 和 move 。第一个原因是如果在循环中调用 make_vector ，我们测得的大多数时间就都在构造上了，copy 和 move 之间的区别无法显示出来；第二个原因，后面会谈到。如果你一定要看看在循环中调用 make_vector 的结果，也就是说把测试代码中的 vector s = src; 和 vector s = move(src); 分别替换为 vector s = make_vector(); 和 vector s = move(make_vector()); 在我这里运行结果是这样的 Vector copy ctor takes: 7928 Vector move ctor takes: 3587 很明显，两个循环多执行的时间大致相同，那就是构造对象的时间了。在 C++ 里，凡事都有例外如果我们把测试对象换成 string，在 string 的大小比较大的时候，结果大体相似，例如下面的程序测试 copy 和 move 大小为 20 的 string： view plaincopy to clipboardprint? 1. #include 2. #include 3. #include 4. using namespace std; 5. int main() 6. { 7. string src(20, 'e'); 8. clock_t start, end; 9. start = clock(); 10. for (int i = 0; i < 1000000; ++i) 11. { 12. string s = src; 13. } 14. end = clock(); 15. cout << "String copy ctor takes: " << end - start << endl; 16. start = clock(); 17. for (int i = 0; i < 1000000; ++i) 18. { 19. string s = move(src); 20. } 21. end = clock(); 22. cout << "String move ctor takes: " << end - start << endl; 23. return 0; 24. } #include #include #include using namespace std; int main() { string src(20, 'e'); clock_t start, end; start = clock(); for (int i = 0; i < 1000000; ++i) { string s = src; } end = clock(); cout << "String copy ctor takes: " << end - start << endl; start = clock(); for (int i = 0; i < 1000000; ++i) { string s = move(src); } end = clock(); cout << "String move ctor takes: " << end - start << endl; return 0; } 在我这里，输出差不多是 String copy ctor takes: 1728 String move ctor takes: 40 由于拷贝 string 是一个比较快的操作，所以差距没有那么大，但仍然相当明显。到这里，你一定会说“好，从此我一定会在代码里让 rvalue reference 和 move 满天飞” 然而，如果你把 string src 的尺寸缩小一点，到达15的时候，情况变了，输出差不多是 String copy ctor takes: 40 String move ctor takes: 42 为什么拷贝一个15个字符的 string 比拷贝20个字符快那么多？读读 string 类就会发现，string 类会给自己预分配16字节的 buffer，如果拷贝对象不超过15个字符，就不需要重新分配空间，只需要调用 memcpy 就可以，这是一个相当高效的操作。而 move 在这种情况下则选择不进行指针交换，而是调用 memmove，这往往比 memcpy 要慢一些。我们得出什么结论呢？有几个 1. 拷贝，尤其是少量数据的拷贝，其实很高效 2. 动态内存分配相当昂贵，从上面的结果可以大致推断出，分配一片空间大概比拷贝20个字节多花40倍的时间 3. 小字符串（15个字符以下）的拷贝已经足够优化了我还没有打算到此打住，如果就这么简单，那就不是 C++ 了。如果仔细考察对象的 copy 和 move ，事情会更加复杂。返回值和 RVO 写一个很简单的类 Foo，它的作用是帮我们了解 copy 和 move 之间，到底发生了什么事。 view plaincopy to clipboardprint? 1. #include 2. using namespace std; 3. struct Foo 4. { 5. Foo() { cout << "Foo ctor" << endl; } 6. Foo(const Foo&) { cout << "Foo copy ctor" << endl; } 7. void operator=(const Foo&) { cout << "Foo operator=" << endl; } 8. Foo(Foo&&) { cout << "Foo move ctor" << endl; } 9. ~Foo() { cout << "Foo dtor" << endl; } 10. void bar() {} 11. }; 12. Foo make_foo() 13. { 14. return Foo(); 15. } 16. int main() 17. { 18. cout << "Copy from rvalue: " << endl; 19. Foo f1 = make_foo(); 20. cout << "-----------------------" << endl; 21. cout << "Move from rvalue: " << endl; 22. Foo f2 = move(make_foo()); 23. cout << "-----------------------" << endl; 24. return 0; 25. } #include using namespace std; struct Foo { Foo() { cout << "Foo ctor" << endl; } Foo(const Foo&) { cout << "Foo copy ctor" << endl; } void operator=(const Foo&) { cout << "Foo operator=" << endl; } Foo(Foo&&) { cout << "Foo move ctor" << endl; } ~Foo() { cout << "Foo dtor" << endl; } void bar() {} }; Foo make_foo() { return Foo(); } int main() { cout << "Copy from rvalue: " << endl; Foo f1 = make_foo(); cout << "-----------------------" << endl; cout << "Move from rvalue: " << endl; Foo f2 = move(make_foo()); cout << "-----------------------" << endl; return 0; } 输出是什么呢？ Copy from rvalue: Foo ctor ----------------------- Move from rvalue: Foo ctor Foo move ctor Foo dtor ----------------------- Foo dtor Foo dtor 怎么回事？当我们 copy 的时候，仅仅只调用了一个 constructor，甚至没有调用 copy constructor ，而我们 move 的时候，却需要调用一个 constructor，一个 move constructor 和一个 destructor。 Move 的情况比较容易理解，分为三步： 1. 调用 constructor 构造一个临时对象 2. 从这个临时对象进行 move constructing 3. 销毁这个临时对象而 copy 为什么这么省事？因为编译器会使用 RVO（return value optimization），在返回值是一个 rvalue 的时候，这个对象会直接构造在接收返回值的对象空间中，从而减少了拷贝。而相反 move 则会阻碍编译器进行 RVO，反而增加了两个函数调用，如果 destructor 涉及动态空间的释放以及一些耗时的操作，那可是偷鸡不成蚀把米。那我们又得到什么结论呢？ 1. RVO 是个好东西 2. 在有 RVO 的时候，move semantics 未必比较快我还没有打算住手，好戏在后面： NRVO 如果把函数 make_foo 改成这个模样： view plaincopy to clipboardprint? 1. Foo make_foo() 2. { 3. Foo f; 4. return f; 5. } Foo make_foo() { Foo f; return f; } 在 Debug 模式运行一下，结果就更加有趣了： Copy from rvalue: Foo ctor Foo move ctor Foo dtor ----------------------- Move from rvalue: Foo ctor Foo move ctor Foo dtor Foo move ctor Foo dtor ----------------------- Foo dtor Foo dtor 为什么？为什么我们明明打算 copy ，却调到了 move constructor；而 move 的时候，却调用了两个 move constructor ？我们一条条的分析。 copy 首先，无论 copy 还是 move，函数 make_foo 中的 Foo f 都会导致一个 constructor 。在这里 f 是一个 lvalue，所以在 copy 时，编译器没法对它进行 RVO，而在 Debug 模式下其它的优化又关掉了，于是只好用返回值构造对象 f1。这里有新东西出现了：新的 C++ 标准要求，在构造返回的临时对象时，如果不使用 RVO，而类定义了 move constructor，优先使用 move constructor。所以我们看到的 move constructor 调用，是用来初始化临时对象的。而有了这个临时对象，编译器倒是可以直接把它扔给 f1，从而节省一道从临时对象到 f1 的拷贝。之后局部对象 f 超出作用范围，被销毁。 move 构造对象 f。和 copy 一样，用 move constructor 构造临时对象。这里问题来了：加入 move() 调用使得编译器无法优化掉临时对象到 f2 的拷贝，于是编译器退而求其次，用 move constructor 来初始化 f2。局部对象 f 被销毁。临时对象被销毁。好的，我们看到 move() 又杯具了，如果是 Release 模式，会如何呢？结果是这样的： Copy from rvalue: Foo ctor ----------------------- Move from rvalue: Foo ctor Foo move ctor Foo dtor ----------------------- Foo dtor Foo dtor 这里 copy 和 move 双方各减少了一个对象生成。是哪一个呢？答案是临时对象。这要归功于编译器的 NRVO (Named Return Value Optimization)，这种优化让编译器能够在返回一个 lvalue 的情况下，也减少一个对象 copy（或 move），但是这并没能优化掉对于 f2 的构造。结论 Rvalue reference, move semantics 都是好东西，std::move() 也是好东西，但是用得不对可能会适得其反。事实上，在有了 move semantics 之后，最高效的的返回正是我们熟悉的形式： view plaincopy to clipboardprint? 1. Foo make_foo() 2. { 3. Foo f; 4. return f; 5. } 6. …… 7. Foo f1 = make_foo(); Foo make_foo() { Foo f; return f; } …… Foo f1 = make_foo(); 因为编译器会尽可能的使用 RVO 和 NRVO，而在无法使用这些优化时，由于 make_foo 返回一个 rvalue ，编译器仍会尽力调用 move constructor，而只有这些都失败了，编译器才会采取我们熟悉的 copy constructor --- 总之，不会比这个更坏了。