目录
一:vector的成员变量与迭代器
- 我们知道vector里面可以存各种数据类型,所以必定会用到模板,假设vector的模板参数为T,那么T*这个指针封装后就是vector的迭代器
- 和string的迭代器很像,只不过string确定存的是字符,所以迭代器直接是char的指针,而vector存的数据类型不确定,就使用T的指针
- 而vector的3个成员变量_start,_finish,_endofstorage也就是3个迭代器,分别指向vector的开头,vector有效数据的结尾,vector容量的结尾
template <class T>
class vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin() const
{
return _start;
}
const_iterator end() const
{
return _finish;
}
private:
iterator _start;
iterator _finish;
iterator _endofstorage;
};
- 根据这3个迭代器,我们就能轻松的得出vector的size和capacity,就是用_finish和_endofstorage分别与_start相减
- operator[]就更简单了,和我们使用一维数组时一样,直接返回_start[pos]
- 当_start==_finish,我们就能确定vector目前为空
size_t size() const
{
return _finish - _start;
}
size_t capacity() const
{
return _endofstorage - _start;
}
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos) const
{
assert(pos < size());
return _start[pos];
}
bool empty() const
{
return _start == _finish;
}
二:vector的构造与析构
- 普通的构造和析构很简单,不用多说
- 主要关注支持迭代器的构造函数,我们需要重新搞一个迭代器,因为如果直接用之前封装的iterator当参数,那么只支持传vector的迭代器构造
- 我们换成模板参数后,则可以支持任意容器的迭代器来构造vector
vector()
{
_start = nullptr;
_finish = nullptr;
_endofstorage = nullptr;
}
~vector()
{
if (_start)
{
delete[] _start;
}
_start = _finish = _endofstorage;
}
template <class InputIterator>
vector(InputIterator first, InputIterator end)
:_start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
while (first != end)
{
push_back(*first);
first++;
}
}
三:reserve与resize
1.reverse
-
vector当容量不足时需要扩容,reserve的重要性不言而喻,后面的insert,push_back,拷贝构造都需要用到,但是编写代码时却很容易出错
-
大家应该都能想到,先判断传入的参数是否大于目前容量,大于则进行扩容,即申请一块新的空间,将旧的空间数据拷贝过去,然后释放旧空间,最后更新3个成员变量的指向
-
最容易错的地方就是将旧空间的数据拷贝到新空间的这一步
-
我们通常会想到memcpy,方便快捷,还是内存拷贝,不用担心数据类型,似乎毫无问题,但其实有着重大的隐患
-
如果vector中存的是内置类型,比如int,char那么没有什么问题,但是要是存的是string,问题就来了
-
memcpy直接拷贝了string的_str,_size,_capacity,而_str指向了一片堆上的空间,这就变成了浅拷贝,完成拷贝后,我们释放旧空间,编译器也会调用string的析构函数释放其指向的空间
-
那我们新空间的_str就成了野指针,指向了一片未知空间,最后vector使用完毕调用析构函数时,就会再次释放_str指向的空间,而此时这片空间已经被释放过了,不再是堆上分配来的空间,我们无权释放,硬性释放会导致我们的程序崩溃
-
解决方法就是不使用memcpy,而是遍历使用=操作符进行赋值,对于string,编译器会调用string的operator=完成深拷贝,就可以避免上述问题
void reserve(size_t n)
{
size_t len = size();
if (n > capacity())
{
T* tmp = new T[n];
if (_start)//_start不为空指针
{
//禁止使用memcpy,对于需要深拷贝的对象会出问题
//比如vector<string>
for (int i = 0; i < len; i++)
{
tmp[i] = _start[i];//string的operator=
}
delete[] _start;
}
_start = tmp;
_finish = _start + len;
_endofstorage = _start + n;
}
}
2.resize
- 相比于reverse,resize就要简单许多
- 需要注意的是T类型的参数如何进行缺省,
const T& val = T()
,利用T类型的自己的构造函数构造一个匿名对象作为缺省值 - 当n小于vector容量时,直接修改_finish
- 当n大于vector容量时,扩容后将val拷贝进去
void resize(size_t n, const T& val = T())
{
if (n <= size())
{
_finish = _start + n;
}
else
{
if (n > capacity())
{
reserve(n);
}
while (_finish < _start + n)
{
*_finish = val;
_finish++;
}
}
}
四:拷贝构造与operator=
1. 拷贝构造
- 进行拷贝构造时我们也容易使用memcpy进行拷贝,也会造成和reserve一样的问题
- 所以我们可以用另一种巧妙的方式避免浅拷贝,那就是遍历要拷贝的vector,将其中每一个数据push_back进新的vector中
- 而push_back是通过_finish=x进行赋值的,会调用相应类型的operator=,而完成深拷贝
- 还有一个细节就是,我们遍历进行push_back之前需要先对新的vector进行reserve保证两个vector最终容量一直
- 如果直接push-back,可能新的vector容量只有原vector的size的大小,造成容量不一致
vector(const vector<T>& v)
:_start(nullptr)
, _finish(nullptr)
, _endofstorage(nullptr)
{
reserve(v.capacity()); //直接push_back的话capacity可能不一样大
for (auto e : v)
{
push_back(e);
}
/*_start = new T[v.capacity()];
memcpy(_start, v._start, sizeof(T) * v.size());
_endofstorage = _start + v.capacity();
_finish = _start + v.size();*/
}
2.operator=
- operator=的编写可以参考Date类的operator=
- 关键就是传参是不传引用,使其传参时完成一次拷贝构造,然后把这个完成拷贝构造后的vector和目前的vector进行交换
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endofstorage, v._endofstorage);
}
vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
五: 插入与删除
1.push_back
- push_back要注意的是vector可能为空或者容量不足,我们需要先进行扩容后,再进行插入
void push_back(const T& x)
{
if (_finish == _endofstorage)
{
size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
}
*_finish = x;
_finish++;
}
2.pop_back
- pop_back我们也不用真删,修改_finish的值即可,前提是vector不为空,为空就不能再删了
void pop_back()
{
assert(!empty());
_finish--;
}
3.insert
- insert注意插入的位置不能超过_finish,因为insert是在pos位置的后面插入,所以pos最多到_finish-1
- 与push_back相同,insert也要先检查容量,容量不足时扩容后才能进行插入
- 当扩容后,pos迭代器失效,因为此时pos还指向之前旧空间的位置,我们需要更新pos才能正常进行插入
- 插入时需要把pos以后的数据往后移动,所以insert是个O(n)的接口,不推荐频繁使用
iterator insert(iterator pos, const T& x)
{
assert(pos < _finish);
if (_finish == _endofstorage)
{
size_t len = pos - _start;
size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
reserve(newcapacity);
pos = _start + len;
}
iterator end = _finish - 1;
while (end >= pos)
{
*(end + 1) = *end;
end--;
}
*pos = x;
_finish++;
return pos;
}
4.erase
- 要删除的位置要小于_finish,_finish没有存数据,所以pos最多到_finish-1
- 同样erase也是时间为O(n)的接口,不推荐频繁使用
iterator erase(iterator pos)
{
assert(pos < _finish);
iterator it = pos + 1;
while (it != _finish)
{
*(it - 1) = *it;
it++;
}
_finish--;
return pos;
}
5.插入和删除导致的迭代器失效
- reserve,resize,insert,push_back会造成vector扩容的操作,都会让vector的迭代器失效
- 根本原因是扩容时vector已经有了新的空间,而迭代器还在指向被释放了旧空间造成
- erase同样可能导致迭代器失效,按理来说,删除pos位置元素,之后的元素会往前移,迭代器应该不会失效,但是尾删时,迭代器会指向_finish位置,而-finish位置是没有元素的,此时也认为迭代器失效了
- 如何解决?
- 使用前,对迭代器重新赋值即可