目录
一、vector类
1、 vector是表示可变大小数组的序列容器。2、 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。3、 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。4、 vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。
上面的图片来自于《STL源码剖析》这本书。从图中我们就可以看出vector实现的基本形式。vector类的成员变量是三个指针。指向起始位置的 _start ,指向最后一个数据的下一个位置的_finish,指向容量的下一个位置的_end_of_storage。
下面的代码就是vector类实现的基本框架
template<class T>
class vector
{
typedef T* iterator;
typedef const T* const_iterator;
private:
//三者均为指针
iterator _start;
iterator _finish;//最后一个数据的下一个位置
iterator _end_of_storage;//容量的下一个位置
};
二、构造函数及析构函数
1、构造函数
将三个指针全都置成空。
vector()
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{}
2、析构函数
delete掉 _start的空间,将三者置成nullptr。
~vector()
{
delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
三、vector的迭代器
vector的迭代器是一个指针。并分为 iterator 和 const_iterator两种类型,非const 对象调用前者,const对象调用后者。
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin()const
{
return _start;
}
const_iterator end()const
{
return _finish;
}
四、vector空间增长问题
1、size
size_t size()const
{
return _finish - _start;
}
2、capacity
size_t capacity()const
{
return _end_of_storage - _start;
}
3、empty
bool empty()const
{
return size() == 0;
}
4、resize
void resize(size_t n, const T& val = T())
{
if (n > capacity())
{
reserve(n);
}
if (n > size())
{
while (_finish < _start + n)
{
*_finish = val;
_finish++;
}
}
else
{
_finish = _start + n;
}
}
5、reserve
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
//memcpy(tmp, _start, sizeof(T) * sz);
//如果是vector<vector<int>>类型,那么在拷贝
//vector中的vector<int>的数据类型时使用memcpy是浅拷贝
//会被析构两次
for (size_t i = 0; i < sz; i++)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_end_of_storage = _start + n;
}
}
五、vector的增删查改
1、push_back
void push_back(const T& x)
{
if (_finish == _end_of_storage)
{
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
*_finish = x;
_finish++;
}
2、pop_back
void pop_back()
{
assert(_finish > _start);
_finish--;
}
六、其他构造函数
1、拷贝构造函数
//拷贝构造函数 v2(v1)
vector(const vector<T>& v)
{
_start = new T[v.size()];
memcpy(_start, v._start, sizeof(T) * v.size());
_finish = _start + v.size();
_end_of_storage = _start + v.size();
}
vector(const vector<T>& v)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(v.size());
for (const auto& e : v)
{
push_back(e);
}
}
注:上面的第一种写法其实还有一点bug。举个例子:如果vector里的数据类型是 vector<int>,那么在这memcpy就是一个浅拷贝,虽然vector<vector<int>>有自己的空间,但是里面的数据vector<int>却没有自己的空间,memcpy后,两个对象的vector<int>会指向同一块空间。因此有下面的改进方案
vector(const vector<T>& v)
{
_start = new T[v.size()];
for (size_t i = 0; i < v.size(); i++)
{
_start[i] = v._start[i];
}
_finish = _start + v.size();
_end_of_storage = _start + v.size();
}
2、构造并初始化
vector(size_t n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; i++)
{
push_back(val);
}
}
3、迭代器进行初始化构造
template<class InputIterator>
vector(InputIterator first, InputIterator last)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
while (first != last)
{
push_back(*first);
first++;
}
}
有了迭代器的区间构造,我们就可以写出拷贝构造函数的现代写法
void swap(vector<T> v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
vector(const vector<T>& v)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
vector<T> tmp(v.begin(), v.end());
swap(tmp);
}
七、运算符重载
1、下标访问 [ ]
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos)const
{
assert(pos < size());
return _start[pos];
}
2、赋值构造
//v1 = v2
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
八、迭代器失效问题(重难点)
1、insert
void insert(iterator pos, const T& x)//返回新插入位置的迭代器 pos
{
assert(pos >= _start);
assert(pos <= _finish);
//满了就扩容:扩容后pos的原位置失效,需要更新pos的位置,
if (_finish == _end_of_storage)
{
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
iterator end = _finish - 1;
while (pos <= end)
{
*(end + 1) = *end;
end--;
}
*pos = x;
_finish++;
}
从上面的图中我们可以看出程序出现了错误,这是为什么呢?这是因为我们在第一次扩容时开辟了4个数据的空间,然后插入了4个数据。这时如果我们再插入数据 ,那么就会发生扩容,也就是会重新开辟空间,而重新开辟空间后pos的位置就没有指向新空间的pos的位置了,pos成为了一个野指针。因此迭代器就失效了。为了解决这个问题,我们就需要重新找到pos的位置,并返回这个位置。
iterator insert(iterator pos, const T& x)//返回新插入位置的迭代器 pos
{
assert(pos >= _start);
assert(pos <= _finish);
//满了就扩容:扩容后pos的原位置失效,需要更新pos的位置,
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len;
}
iterator end = _finish - 1;
while (pos <= end)
{
*(end + 1) = *end;
end--;
}
*pos = x;
_finish++;
return pos;
}
2、erase
void erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator begin = pos + 1;
while (begin < _finish)
{
*(begin - 1) = *begin;
begin++;
}
_finish--;
}
erase也有失效的情况。
void test()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//删除所有偶数
auto it = v.begin();
while(it != v.end())
{
if(*it % 2 == 0)
{
v.erase(*it);
}
it++;
}
for(auto e : v)
{
cout << e << " ";
}
}
push_back下面的数及对应结果。
1 2 3 4 5 正常运行
1 2 3 4 崩溃
1 2 4 3 4 5 结果不对
为什么会这样呢?看下图
第二种情况是it和end()已经错过了,且it已经越界了,永远不会相等了。
所以正确的代码如下:
//指向擦除的最后一个元素之后的元素的新位置。pos
iterator erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator begin = pos + 1;
while (begin < _finish)
{
*(begin - 1) = *begin;
begin++;
}
_finish--;
return pos;
}
void test()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
//删除所有偶数
auto it = v.begin();
while(it != v.end())
{
if(*it % 2 == 0)
{
it = v.erase(*it);
}
else
{
it++;
}
}
for(auto e : v)
{
cout << e << " ";
}
}
九、总代码
using namespace std;
namespace zdl
{
template<class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin()const
{
return _start;
}
const_iterator end()const
{
return _finish;
}
vector()
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{}
//拷贝构造函数 v2(v1)
vector(const vector<T>& v)
{
_start = new T[v.size()];
//memcpy(_start, v._start, sizeof(T) * v.size());
/*如果是vector<vector<int>>类型,那么在拷贝
vector中的vector<int>的数据类型时使用memcpy是浅拷贝
会被析构两次*/
for (size_t i = 0; i < v.size(); i++)
{
_start[i] = v._start[i];
}
_finish = _start + v.size();
_end_of_storage = _start + v.size();
}
/*vector(const vector<T>& v)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(v.size());
for (const auto& e : v)
{
push_back(e);
}
}*/
//现代写法
/*vector(const vector<T>& v)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
vector<T> tmp(v.begin(), v.end());
swap(tmp);
}*/
//eg : 10个1构造
vector(size_t n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; i++)
{
push_back(val);
}
}
vector(int n, const T& val = T())
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
reserve(n);
for (size_t i = 0; i < n; i++)
{
push_back(val);
}
}
//迭代器区间构造
template<class InputIterator>
vector(InputIterator first, InputIterator last)
:_start(nullptr)
, _finish(nullptr)
, _end_of_storage(nullptr)
{
while (first != last)
{
push_back(*first);
first++;
}
}
void swap(vector<T> v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_end_of_storage, v._end_of_storage);
}
//v1 = v2
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
~vector()
{
delete[] _start;
_start = _finish = _end_of_storage = nullptr;
}
size_t size()const
{
return _finish - _start;
}
size_t capacity()const
{
return _end_of_storage - _start;
}
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)
{
//memcpy(tmp, _start, sizeof(T) * sz);
//如果是vector<vector<int>>类型,那么在拷贝
//vector中的vector<int>的数据类型时使用memcpy是浅拷贝
//会被析构两次
for (size_t i = 0; i < sz; i++)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_end_of_storage = _start + n;
}
}
void push_back(const T& x)
{
if (_finish == _end_of_storage)
{
reserve(capacity() == 0 ? 4 : capacity() * 2);
}
*_finish = x;
_finish++;
}
void pop_back()
{
assert(_finish > _start);
_finish--;
}
iterator insert(iterator pos, const T& x)//返回新插入位置的迭代器 pos
{
assert(pos >= _start);
assert(pos <= _finish);
//满了就扩容:扩容后pos的原位置失效,需要更新pos的位置,
if (_finish == _end_of_storage)
{
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len;
}
iterator end = _finish - 1;
while (pos <= end)
{
*(end + 1) = *end;
end--;
}
*pos = x;
_finish++;
return pos;
}
//指向擦除的最后一个元素之后的元素的新位置。pos
iterator erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator begin = pos + 1;
while (begin < _finish)
{
*(begin - 1) = *begin;
begin++;
}
_finish--;
return pos;
}
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos)const
{
assert(pos < size());
return _start[pos];
}
void resize(size_t n, const T& val = T())
{
if (n > capacity())
{
reserve(n);
}
if (n > size())
{
while (_finish < _start + n)
{
*_finish = val;
_finish++;
}
}
else
{
_finish = _start + n;
}
}
private:
//三者均为指针
iterator _start;
iterator _finish;//最后一个数据的下一个位置
iterator _end_of_storage;//容量的下一个位置
};
}