vector模拟实现
vector介绍
vector介绍
- vector是表示可变大小数组的序列容器。
- 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
- 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
- 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
- 与其它动态序列容器相比(deques, lists and forward_lists), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起lists和forward_lists统一的迭代器和引用更好。
vector常用功能介绍
因为STL中的容器基本功能都差不多,前面已经学习过string了这里就简单介绍一下vector的用法
vector本质上是一个动态数组
1.构造函数
声明 | 接口说明 |
---|---|
vector() | 无参构造 |
vector(size_type n, const value_type& val = value_type()) | 构造并初始化n个val |
vector (const vector& x) | 拷贝构造 |
:vector (InputIterator first, InputIterator last);: | 使用迭代器进行初始化构造 |
2.迭代器的使用
iterator的使用 | 接口说明 |
---|---|
begin + end | 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置的iterator/const_iterator |
rbegin + rend | 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的reverse_iterator |
end是数组最后一个有效数据位置的下一个位置
rend是数组第一个位置的前一个位置
3. vector容量相关的使用
声明 | 接口说明 |
---|---|
size | 获取数据个数 |
capacity | 获取容量大小 |
empty | 判断是否为空 |
resize | 改变vector的size |
reserve | 改变vector的capacity |
vs下capacity是按1.5倍增长的,g++是按2倍增长的,不要固化的认为,顺序表增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL
reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
resize在开空间的同时还会进行初始化,影响size。
vector 增删查改
vector增删查改 | 接口说明 |
---|---|
push_back | 尾插 |
pop_back | 尾删 |
find | 查找。(注意这个是算法模块实现,不是vector的成员接口) |
insert | 在position之前插入val |
erase | 删除position位置的数据 |
swap | 交换两个vector的数据空间 |
operator[] | 像数组一样访问\ |
vector简单模拟实现
#ifndef MY_VECTOR_H
#define MY_VECTOR_H
#include <iostream>
using namespace std;
namespace dd
{
template<class T>
class My_vector
{
public:
typedef T* iterator;
typedef const T* const_iterator;
private:
iterator _start; 起始位置地址
iterator _finish; 有效数据的下一个位置地址
iterator _endofstorage; 容量所在位置的地址
};
}
#endif MY_VECTOR_H
构造函数(无参)
My_vector()
:_start(nullptr)
,_finish(nullptr)
,_endofstorage(nullptr)
{}
析构函数
~My_vector()
{
delete[] _start;
_start = nullptr;
_finish = nullptr;
_endofstorage = nullptr;
}
size
size_t size()
{
return _finish - _start; //(arr+size) - (arr+0)
}
capacity
size_t capacity()
{
return _endofstorage - _start;
}
迭代器
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator begin()const
{
return _start;
}
const_iterator end()const
{
return _finish;
}
operator[ ]
T& operator[](size_t pos)
{
assert(pos < size());
return _start[pos];
}
const T& operator[](size_t pos)const
{
assert(pos < size());
return _start[pos];
}
reserve(有缺陷,改进后的在最下方)
void reserve(size_t n)
{
if(_finish == _endofstorage)
{
T* temp = new T[n];
size_t sz = size();
if(_start)
{
memcpy(temp,_start, sizeof(T) * sz);
delete[] _start;
}
_start = temp;
_finish = _start + sz;//原来的位置
_endofstorage = _start + n;
}
}
new在申请空间时会调用构造函数,调用的个数是n的数值
resize
// 内置类型也支持构造,int i = 10 ;int(i); int j = int(); int k = int(10); 匿名对象生命周期只存在这一行
// T也有可能是内置类型、自定义类型等等,所以缺省值设置一个匿名对象,可以是内置类型也可以是自定义类型
//且const的引用会延长匿名对象的声明周期,在调用结束时才会销毁
void resize(size_t n,const T val = T()) 匿名对象
{
/*if(n <= size())
{
_finish = _start + n;
}
else
{*/
if(n > size())
{
if(n > capacity())
{
reserve(n)
}
//My_vector::iterator it = end();
size_t len = size();
while(len < n)
{
_start[len] = val;
len++;
}
}
_finish = _start + n;
}
}
val = T() 匿名对象的生命周期只存在这一行,但是可以用const延长他的声明周期,调用结束时才会销毁
push_back
void push_back(const T& val)
{
if(_finish == _endofstorage)
{
reserve(capacity() == 0? 4: capacity()*2);
}
*_finish = val;
_finish ++;
}
构造函数(迭代器)
类模板的成员函数,也可以做为函数模板
template <class InputIterator>
My_vector(InputIterator first,InputIterator last)
:_start(nullptr)
,_finish(nullptr)
,_endofstorage(nullptr)
{
while(first != last)
{
push_back(*first);
first++;
}
}
拷贝构造
传统写法
My_vector(const vector<T>& v)
:_start(nullptr)
,_finish(nullptr)
,_endofstorage(nullptr)
{
_start = new T[v.capacity()];
memcpy(_start,v._start,sizeof(T)*v.size());
_finish = _start + v.size();
_endofstorage = _start + v.capacity();
}
现代写法
void swap(vector<T>& v)
{
std::swap(_start,v._start);
std::swap(_finish,v._finish);
std::swap(_endofstorage,v._endofstorage);
}
My_vector(const vector<T>& v)
:_start(nullptr)
,_finish(nullptr)
,_endofstorage(nullptr)
{
My_vector<T> temp(v.begin(),v.end());
swap(temp); //this->swap(temp)
}
operator =
My_vector<T>& operator=(vector<T> v)
{
swap(v);
return *this;
}
pop_back
void pop_back()
{
assert(size());
_finish--;
}
insert
void insert(iterator pos,const T& val)
{
assert(pos >= _start);
assert(pos <= _finish);
if(_finish == _endofstorage)
{
reserve(capacity() == 0?4:capacity()*sizeof(T));
}
My_vector::iterator it = end()-1; //与string不同的是。这里不需要拷贝\0,finish位置是空的
while(it >= pos)
{
*(it+1) = *it;
it--;
}
/*for(size_t i = size()-1;i >= pos-_start;i--)
{
_start[i+1] = _start[i];
}*/
*pos = val;
_finish++;
}
迭代器失效问题1
但是上述代码中存在着一个隐患
My_vector<int> v1
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
vector<int>::iterator pos = find(v1.begin(),v2.end(),2);
if(pos != v1.end())
{
v1.insert(pos,20);
}
当插入的位置地址是最后一个时,会先扩容,扩容就会把原空间释放并重新开辟空间,那么pos就变成一个野指针了
改进:在扩容之前算出距离长度,扩容之后更新pos
if(_finish == _endofstorage)
{
size_t len = pos - _start;
reserve(capacity() == 0?4:capacity()*sizeof(T)*2);
pos = _start + len;
}
但是外面的it仍然是野指针,这种情况就叫迭代器失效
erase
void erase(iterator pos)
{
assert(pos < _finish);
assert(pos >= _start);
My_vector::iterator it = pos;
while(it+1 < _finish)
{
*it = *(it+1);
it++;
}
_finish--;
}
迭代器失效问题2
假如利用erase删除所有偶数
My_vector<int> v1
情况一:
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
v1.push_back(5);
情况二:
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
情况三:
v1.push_back(1);
v1.push_back(2);
v1.push_back(4);
v1.push_back(5);
My_vector::iterator it = v1.begin();
while(*it != v1.end())
{
if(*it %2 == 0)
{
erase(it);
}
it++;
}
情况1:可以正常执行完
情况2:会崩溃
原因:当删除完最后一个,finish–,此时v1.end()位置就往前挪了一位,而删完后it++导致他往后挪了 一位,这时it和end就错过了,在访问时就是非法越界了
情况3:没删完
原因:当删完2时,it++,而finish–,导致错过4,it此时指向5的位置
改进:
while(*it != v1.end())
{
if(*it %2 == 0)
{
erase(it);
}
else
{
it++;
}
}
本篇这里模拟实现只是把_finish改变,实际应用中可能会有缩容的情况,缩容就要先释放再申请,原it就成为野指针,所以最好要返回新it位置(缩容并不常见,但是不能不考虑)
while(*it != v1.end())
{
if(*it %2 == 0)
{
it = erase(it);
}
else
{
it++;
}
}
改进后的 insert、erase
iterator erase(iterator pos)
{
assert(pos < _finish);
assert(pos >= _start);
My_vector::iterator it = pos;
while(it+1 < _finish)
{
*it = *(it+1);
it++;
}
_finish--;
return pos;
}
insert也会有扩容后想要获取原it位置的地址情况,虽然用的不多,但也得考虑在内
iterator insert(iterator pos,const T& val)
{
assert(pos >= _start);
assert(pos <= _finish);
if(_finish == _endofstorage)
{
size_t len = pos - _start;
reserve(capacity() == 0?4:capacity()*sizeof(T)*2);
pos = _start + len;
}
My_vector::iterator it = end()-1;
while(it >= pos)
{
*(it+1) = *it;
it--;
}
*pos = val;
_finish++;
return pos;
}
结论:只要用到迭代器访问容器就可能会失效
练习(杨辉三角形vector < vector< int >> 的使用)
代码如下:
class Solution
{
public:
My_vector<My_vector<int>> generate(int numRows)
{
My_vector<My_vector<int>> vv;
vv.resize(numRows);//申请行
for(size_t i = 0;i < vv.size();i++)
{
vv[i].resize(i+1,1); //每行申请列并初始化
for(size_t j = 0;j < vv[i].size();j++)
{
if(j == 0 || j == i)
{
vv[i][j] = 1;
}
else
{
vv[i][j] = vv[i-1][j-1] + vv[i-1][j]; //[2][1] = [1][0]+[1][1]
}
}
}
return vv;
}
};
vector<vector>和二维数组类似
T等价于 vector, 此时_start就是vector的指针,对vv扩容,相当于申请了5个vector型的内存
在申请自定义类型的空间时,new会调用构造函数,delete会调用析构函数,而malloc与free不会。
申请多少个就调用多少次
调用的是无参的,所以vector里的成员函数都是空指针
当对vector中的vector申请内存时,需要先解引用vv[0],代表第一个vector的实例化对象,(类似于数组指针或二维数组中,对列解引用得到的是一维数组名)
之后再调用vv[0].vectorresize();就是对第一个vector申请内存了
vector和vector<vector>的理解型式差不多
reserve中,memcpy深拷贝问题
void reserve(size_t n)
{
if(_finish == _endofstorage)
{
T* temp = new T[n];
size_t sz = size();
if(_start)
{
memcpy(temp,_start, sizeof(T) * sz);
delete[] _start;
}
_start = temp;
_finish = _start + sz;//原来的位置
_endofstorage = _start + n;
}
}
上述代码还有一个漏洞,那就是memcpy
例如,vector<vector<int.>> 或者vector <.string>
vector<string> v1;
v1.push_back("1111");
v1.push_back("1111");
v1.push_back("1111");
v1.push_back("1111");
v1.push_back("1111");
当发生扩容时,最后程序会崩溃
如图所示:
memcpy是按字节序拷贝的,是浅拷贝,str中是char*,是动态的
temp拷贝_start只是拷贝了相同的首地址标号,但拷贝完释放_start时,temp拷贝的数据就不存在了,并且在最后调用扩容函数结束时temp会销毁,随即调用析构,等于对一块空间析构两次
改进reserve
改进办法如下:
void reserve (size_t n)
{
if(n > capacity())
{
size_t sz = size();
T* temp = new T[n];
if(_start)
{
//memcpy(temp,_start,sizeof(T)*size()); //error
for(size_t i = 0; i < sz;i++)
{
temp[i] = _start[i];
}
delete[] _start;
}
_start = temp;
_finish = _start + sz;
_endofstorage = _start + n;
}
}
根据上面的图示做修改,利用string赋值重载就可以避免这个问题了;
只要涉及到深拷贝就不可以用memcpy,因为他是按字节序拷贝的,是浅拷贝