本文基于SGI STL vector源码分析其底层实现,只关注核心实现,不考虑空间配置器allocator。
一、vector概述
vector的数据安排以及操作方式,与array非常相似。两者的唯一区别在于空间的运用的灵活性。array是静态空间,一旦配置了就不能改变,要换个大(或小)一点的房子,可以,一切琐细得由客户端自己来:首先配置一块新空间,然后将元素从旧址一一搬往新址,再把原来的空间释还给系统。而vector是动态空间,随着元素的加入,它的内部机制会自行扩充空间以容纳新元素。因此,vector的运用对于内存的合理利用与运用的灵活性有很大的帮助,因此不必因为担心空间不足而一开始就要一个大块头array了。
二、vector的迭代器
vector维护的是一个连续线性空间,所以不论其元素类型是什么,普通指针都可以作为vector的迭代器而满足所有必要条件,因为vector迭代器所需要的操作行为,如operator*,operator->,operator++,operator–,operator+,operator-,operator+=,operator-=,普通指针天生就具备。vector支持随机存取。
三、vector的定义
vector所采用的数据结构非常简单:线性连续空间。它以两个迭代器start和finish分别指向配置得到的连续空间中目前已被使用的范围,并以迭代器end_of_storage指向整块连续空间的尾端。
template <class T, class Alloc = alloc>
class vector{
public:
...
protected:
iterator start; //表示目前使用空间的头部
iterator finish; //表示目前使用空间的尾部
iterator end_of_storage; //表示目前可用空间的尾部
private:
...
};
两个关键大小:
大小:size() = finish - start;
容量:capacity() = end_of_storage - start;
如下图所示,size()表示vector中已有元素的个数,capacity()表示vector最多可存储的元素的个数。
为了降低二次分配时的成本,vector实际配置的大小可能比客户需求的更大一些,以备将来扩充,这就是容量的概念。即capacity>=size,当等于时,容器此时已满,若再要加入新的元素时,就要重新进行内存分配,整个vector的数据都要移动到新内存。二次分配成本较高,在实际操作时,应尽量预留一定空间,避免二次分配。
四、vector构造与内存管理
1、构造
vector的构造函数主要有以下几种:
template <class T, class Alloc = alloc>
vector():start(0), finish(0), end_of_storage(0){
}
vector(size_type n, const T& value){
fill_initializa(n, value);
}
vector(int n, const T& value){
fill_initializa(n, value);
}
vector(long n, const T& value){
fill_initializa(n, value);
}
explicit vector(size_type n){
fill_initializa(n, T());
}
由上述构造函数知,基本上所有构造函数都是基于fill_initialize()实现的。
//填充并予以初始化
void fill_initialize(size_type n, const T& value){
start = allocate_and_fill(n, value);
finish = start + n;
end_of_storage = finish;
}
//配置而后填充
iterator allocate_and_fill(size_type n, const T& x){
iterator result = data_allocator::