vector的push_back操作是将一个元素插入vector的末尾。
源码如下:
template
void YVector::push_back(const T&x)
{if (finish !=end_of_storage)
{
construct(finish, x);++finish;
}else{
insert_aux(finish, x);
}
}
函数insert_aux
template
void YVector::insert_aux(iterator position, const T&x)
{if (finish !=end_of_storage)
{
construct(finish,*(finish - 1));++finish;
T copy_x=x;
copy_backward(position, finish- 2, finish - 1);*position =copy_x;
}else{const size_type old_size =size();const size_type new_size = old_size == 0 ? 1 : 2 *old_size;
iterator new_start=data_allocator::allocate(new_size);
iterator new_finish=new_start;try{
new_finish=uninitialized_copy(start, position, new_start);
construct(new_finish, x);++new_finish;
new_finish=uninitialized_copy(position, finish, new_finish);
}catch(...)
{
destroy(new_start, new_finish);
data_allocator::deallocate(new_start, new_size);throw;
}
destroy(begin(), end());
deallocate();
start=new_start;
finish=new_finish;
end_of_storage= new_start +new_size;
}
}
需要理解以上源码并不容易。看我一一道来。
1.start,finish,end_of_storage
首先必须了解vector的数据结构。如图:
vector是一段连续的内存空间。start,finish,end_of_storage三个指针描述了空间状态,这三个是普通的指针。start到finish是已经使用的内存,里面有元素。finish到end_of_storage是未使用的内存,里面没有元素。
由此三个指针可以得出一些简单的操作。
iterator begin() { return start; } //起始位置
iterator end() { return finish; } //结束位置
size_type size() const { return size_type(end() - begin()); } //已可用大小
size_type capacity() const { return size_type(end_of_storage - begin()); } //申请的内存大小
bool empty() { return begin() == end(); } //是否为空
reference operator[](size_type n) { return *(begin() + n); } //[]操作
reference front() { return *begin(); } //首元素
reference back() { return *(end() - 1); } //尾元素
其中一些定义
typedef T value_type;
typedef value_type*pointer;
typedef value_type*iterator;
typedef value_type&reference;
typedef size_t size_type;
2.construct,destroy
这个两个是全局的构造和析构函数。其中construct是调用placement new。
有关于placement new,参考 http://www.cnblogs.com/luxiaoxun/archive/2012/08/10/2631812.html
templateinlinevoid construct(T1* p, const T2&value)
{new(p)T1(value);
}
placement new可以简单理解成在已经分配好的空间上构造。
在puch_back这里的情境中,如果内存的备用区还有空间,则用x在finish指向的空间上构造,同时移动finish指针。这里原本finish指向的空间是已经申请了的,所以使用placement new。
if (finish !=end_of_storage)
{
construct(finish, x);++finish;
}
destroy有两个版本。destroy实现较复杂,参看《STL源码剖析》第二章。只需知道destroy会在指定范围进行析构。
template inlinevoid destroy(T*pointer)
{
pointer->~T();
}
templateinlinevoiddestroy(ForwardIterator first, ForwardIterator last)
{
//实现略
}
3.allocate,deallocate
注意到定义类时出现了Alloc,这其实是配置器。vector默认使用alloc配置器。
template
在基本的alloc上封装一层simple_alloc。如下:
template
classsimple_alloc {static T* allocate(size_t n)
{ return n == 0 ? 0 : (T*)Alloc::allocate(n * sizeof(T)); }static T* allocate()
{ return (T*)Alloc::allocate(sizeof(T)); }static void deallocate(T *p, size_t n)
{ if (n == 0) Alloc::deallocate(p, n * sizeof(T)); }static void deallocate(T *p)
{ Alloc::deallocate(p, sizeof(T)); }
};
实际上内部实现就是调用malloc和free,但是会有复杂的分级配置处理。在此不再讨论。参看《STL源码剖析》第二章。
可以就简单的把allocate,deallocate理解成malloc,free来辅助记忆,但务必记得没那么简单。
4.uninitialized_copy,copy_backward
uninitialized_copy处理如下图:
看起来好复杂……来看一下原型:
template inline ForwardIterator
uninitialized_copy(InputIterator first, InputIterator last, ForwardIterator result)
{return__uninitialized_copy(first, last, result, value_type(result));
}
如果[result,result + (last - first))范围内的迭代器都指向未初始化区域,则uninitialized_copy()会使用copy construct给输入来源[first,last)范围内的每一个对象产生一个拷贝放进输出范围。
更深的实现也贴出来:
template inline ForwardIterator
__uninitialized_copy(InputIterator first, InputIterator last, ForwardIterator result, T*)
{
typedef typename __type_traist::is_POD_type is_POD_type is_POD;return__uninitialized_copy_aux(first, last, result, is_POD());
}
templateinline ForwardIterator
__uninitialized_copy(InputIterator first, InputIterator last, ForwardIterator result, __true_type)
{returncopy(first, last, result);
}
templateinline ForwardIterator
__uninitialized_copy(InputIterator first, InputIterator last, ForwardIterator result, __false_type)
{
ForwardIterator cur=result;for (; last != first; first++, cur++)
{
construct(&*cur, *first);
}returncur;
}
这里面的逻辑是,首先把result的value_type得出,判断是否是POD类型……
如果是POD类型,则调用copy函数,如果不是POD类型,则一个一个调用construct()
所谓POD类型,指的是拥有无意义的构造、析构、拷贝、赋值函数的类型…能不能理解成比较简单的类。
像是如果类成员里有一个其他类的指针,这种复杂的类,需要有特殊的构造函数,就没有默认的那个构造函数。因此是non-POD类型。
接下来回到push_back。insert_aux里面判断还有备用空间的地方,有一个copy_backword函数。来看一下实现:
templateBidirectionalIterator2 copy_backward ( BidirectionalIterator1 first,
BidirectionalIterator1 last,
BidirectionalIterator2 result )
{while (last!=first) *(--result) = *(--last);returnresult;
}
作用是将一个范围中的元素按逆序拷贝到新的位置处。insert_aux截取如下:
if (finish !=end_of_storage)
{
construct(finish,*(finish - 1));++finish;
T copy_x=x;
copy_backward(position, finish- 2, finish - 1);*position =copy_x;
}
这里面有两个问题。第一为什么要有一份拷贝T copy_x = x;问题的答案参考知乎 https://www.zhihu.com/question/56911557/answer/150928396
第二个 copy_backward(position,finish - 2,finish - 1) 在插入位置是末尾的时候不会死循环吗?黑人问号?
position其实是finish - 1,也就是说传入参数后first比last还后面,那岂不是死循环?
引用:
1.《STL源码剖析》
2.http://www.cnblogs.com/luxiaoxun/archive/2012/08/10/2631812.html