C++ 中的 vector 长度是如何动态增长的
推荐我的个人博客: blog.wuzhenyu.com.cn
下面这篇文章的前半部分,是一篇译文,原文地址1:http://www.drdobbs.com/c-made-easier-how-vectors-grow/184401375
c++ 标准库函数默认情况下提供了合理的性能,但是,如何做到“合理”的呢,read on next.
介绍
假如我们需要从一个文件中读取一组 double 类型的值,并保存在一个数据结构中,我们可以通过以下方式很快速的实现:
vector<double> values;
double x;
while (cin >> x)
values.push_back(x);
当循环结束时,values 将保存所有这些值。我们可以通过变量 i 和 values[i] 来快速访问这些值。
直观来说,标准库函数中的 vector 类就像是一个内置数组:我们可以把他想象成一组保存数据的连续的内存块,能够通过 values[i] 来访问。确实,C++ 标准并没有明确规定 vector 的元素必须占用连续的内存块,但是 2000 年 10 月的标准委员会 (the standard commitee) 会议通过,认为这是一项疏忽,并把这个要求加入到了它的技术勘误表中 (Technical Corrigendum)。这一迟来的决定,并没有造成多大的问题,因为使用 vector 实现的这些代码中,都是按照这个约定来工作的。
如果 vector 的元素是保存在连续的内存中的,那么就可以很容易的理解 vector 的元素访问为什么如此高效了 - 这就像是数组一样,能够对数据元素随机存取 (it simply uses the same mechanism as the built-in arrays use.)。但是,不容易理解的是, vector 是如何高效的组织元素自己动态增长的呢,因为保存在连续的内存中,不可避免的需要将数据从一个内存块复制到另一个内存块。现在处理器在处理连续内存块的复制方面已经可以做到很高效了,但是这些拷贝是不被释放的,会占用大量的内存。因此,需要思考,标准库函数中 vector 的增长,在没有占用大量时间和空间的情况下,是如何实现的。
下面来讨论一种简单、高效的策略来管理这种动态内存的增长。
大小和容量 (size and capacity)
想要弄清楚 vector 是如何工作的,首先就要清楚 vector 并不仅仅是一个连续的内存块,每一个 vector 都有两个相关两的内存块。一个是大小块,保存有 vector 元素个数,另一个为容量,是 vector 的整个内存大小,能