详解Vector
vector的介绍及接口使用
介绍
vector是表示可变大小数组的序列容器。
就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起list和forward_list统一的迭代器和引用更好。
我们学习STL时,需要做到能用,能理,能扩展,因此我们需要从能用开始,下面我们先熟悉接口的使用,其次我们会查看vector的底层,能够理解,再其次我们要自模拟实现vector,做到能扩展。
接口使用
主要介绍需要重点掌握的接口
构造相关
构造函数声明 | 接口说明 |
---|---|
vector()重点 | 无参构造函数 |
vector(size_type n,const value_type& val=value_type()) | 构造并初始化n个val |
vector(const vector& x);(重点) | 拷贝构造函数 |
vector(Inputlterator first,Inputiterator last); | 使用迭代器进行初始化构造 |
//验证构造相关函数
void test_vector1()
{
//需指明类型
//构造一个int类型数组
vector<int> v1();
//构造一个char类型的数组,数组大小为10,每个数组元素的内容为1
vector<char> v2(10, '1');
//拷贝构造,以v2为参照构造一个新对象
vector<char> v3(v2);
//使用迭代器拷贝构造v3对象的部分内容
vector<char> v4(v3.begin(), v3.end());
}
迭代器相关
iterator的使用 | 接口说明 |
---|---|
begin+end(重点) | 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置的iterator/const_iterator |
rbegin和+rend | 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的reverse_iterator |
//验证迭代器相关
void test_vector2()
{
vector<int> v1(10, 1);
//范围for的验证
for (auto& e : v1)
{
cout << e << " ";
}
cout << endl;
//正向迭代器的验证
vector<int>::iterator it = v1.begin();
while (it != v1.end())
{
if (it != v1.begin())
{
*it += *(it - 1);
cout << *it << " ";
it++;
}
else
{
cout << *it << " ";
it++;
}
}
cout << endl;
//反向迭代器的验证
vector<int>::reverse_iterator rit = v1.rbegin();
while (rit != v1.rend())
{
if (rit != v1.rbegin())
{
*rit -= *(rit - 1);
cout << *rit << " ";
rit++;
}
else
{
cout << *rit << " ";
rit++;
}
}
cout << endl;
}
}
运行结果:
空间增长相关
容量空间 | 接口说明 |
---|---|
size | 获取数据个数 |
capacity | 获取容量大小 |
empty | 判断是否为空 |
resize | 改变vector的size |
reserve | 改变vector的capacity |
- capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5**倍增长的,**g++是按2倍增长的。这个问题经常会考察,不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
- reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
- resize在开空间的同时还会进行初始化,影响size。
//测试vector的默认扩容机制
void test_vector_expand()
{
size_t sz = 0;
vector<int> v1;
sz = v1.capacity();
cout << "Making v1 grow:" << endl;
for (int i = 0;i < 100;i++)
{
v1.push_back(i);
if (sz != v1.capacity())
{
sz = v1.capacity();
cout << "capacity changed:" << sz << endl;
}
}
}
}
VS下运行结果:
g++下运行结果:
vs下使用的STL基本是按照1.5倍方式扩容
linux下使用的STL基本是按照2倍方式扩容
验证reserve、resize、empty
//测试代码 void test_vecto5() { vector<int> v1(10,1); cout << "有效长度为:" << v1.size() << endl; cout << "空间总大小为:" << v1.capacity() << endl; cout << "s1是否为空:" << v1.empty() << endl; for (auto& e : v1) { cout << e << " "; } cout << endl; v1.clear(); cout << "有效长度为:" << v1.size() << endl; cout << "空间总大小为:" << v1.capacity() << endl; cout << "s1是否为空:" << v1.empty() << endl << endl; v1.reserve(500); cout << "预留的空间总大小为:" << v1.capacity() << endl << endl; v1.resize(5, 2); cout << "有效长度为:" << v1.size() << endl; cout << "空间总大小为:" << v1.capacity() << endl; cout << "s1是否为空:" << v1.empty() << endl; for (auto& e : v1) { cout << e << " "; } cout << endl; }
运行结果:
如果已经确定vector中要存储元素大概个数,可以提前将空间设置足够就可以避免边插入边扩容导致效率低下的问题了
修改操作相关
vector增删查改 | 接口说明 |
---|---|
push_back | 尾插 |
pop_back | 尾删 |
find | 查找((注意这个是算法模块()实现,不是vector的成员接口)) |
insert | 在position之前插入val |
erase | 删除position位置的数据 |
swap | 交换两个vector的数据空间 |
operator[] | 像数组一样访问 |
//以下举例均为部分常用接口,并不是所有接口
void test_vector6()
{
vector<int> v1;
//push_back一个参数,即尾插的内容
v1.push_back(1);
v1.push_back(2);
v1.push_back(3);
v1.push_back(4);
//popback无参数,直接删除最后一个
v1.pop_back();
//像数组一样访问,可以修改其内容
v1[1] = 3;
vector<int>v2(10, 2);
//find有三个参数,前两个参数是迭代器区间(左闭右开),在此区间找第三个参数的内容
//若找到,返回对应位置的迭代器,若没找到,则返回所给的第二个参数,即区间末尾
//且使用find时跟其他成员函数不一样不用加v. 因为此时的find不是成员函数,而是算法
vector<int>::iterator pos = find(v1.begin(), v1.end(), 3);
if (pos != v1.end())
{
//insert有两个参数,第一个参数为起始位置的迭代器,第二个参数为所要插入的内容
//也可以有三个参数,当有三个参数时,第三个参数为插入内容,第二个参数为个数
v1.insert(pos, 30);
v1.insert(pos,2,30);//在pos前插入2个30
}
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
//找不到
pos = find(v1.begin(), v1.end(), 300);
if (pos != v1.end())
{
//erase只有一个参数时候,直接删除该位置的元素
//有两个参数时,这两个参数对应迭代器区间,即删除此区间内的元素(左闭右开)
v1.erase(pos);
}
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
//交换两个vector数据空间
swap(v1, v2);
for (auto e : v1)
{
cout << e << " ";
}
cout << endl;
}
迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃。
那么什么样的操作才会引起迭代器失效呢?对于vector可能会导致迭代器失效的操作有:
- 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。
//类型会引起崩溃的代码:以下只做举例参考
void test_iterator_failure()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
v.push_back(6);
vector<int>::iterator it = v.begin();
//操作1:将有效元素个数增加到50个,多出的位置使用6填充,操作期间底层会扩容
v.resize(50, 6);
//操作2: reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
v.reserve(100);
//操作3:插入元素期间可能会引起扩容
v.insert(v.begin(), 0);
v.push_back(6);
//重新赋值可能会引起底层容量改变:
v.assign(100, 7);
/*
出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉,
而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的
空间,而引起代码运行时崩溃。
解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新
赋值即可。
*/
it=v.begin();//若没有此步骤,则程序一定会崩溃
while(it!=v.end())
{
cout<<*it<<" ";
++it;
}
cout<<endl;
}
- 指定位置元素的删除操作**–erase**
实例一:
void test_iterator_failure2()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
v.push_back(5);
v.push_back(6);
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
v.erase(pos);
//若不更新迭代器,直接访问pos的话则会出现崩溃
cout << *pos << endl;
//解决方法即更新迭代器即可
}
其实理论上来说erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,迭代器不应该会失效,但是:如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是没有元素的,那么pos就失效了。
因此在vs下,删除vector中任意位置上元素且迭代器没有更新仍指向那一块位置时,则会导致崩溃,而这也就是迭代器失效
注意:Linux下,g++编译器对迭代器失效的检测并不是非常严格,处理也没有vs下极端。
相同的程序放到linux下g++编译器则能够编译完成:
但如果erase删除的是最后一个元素,那还是会引起程序崩溃,因为迭代器实实在在是越界失效了。而vs不是最后一个元素也会失效是因为vs下检测的严格,不同编译器有不同的处理方法,要牢记!
实例二:删除vector中所有的偶数
void test_iterator_failure3() { vector<int> v; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); auto it = v.begin(); while (it != v.end()) { if (*it % 2 == 0) { v.erase(it); } it++; } }
此代码有两个问题:
- 对于元素3,5并没有判断是否为偶数直接就跳过了,因此若有连续的偶数出现则不能删除所有的偶数
- 最后一个数为偶数,因此最后一个数被删除后it会直接++,那么就会与end错开,造成越界
动图展示:
结论:此程序只针对没有连续的偶数且最后一个元素不是偶数的vector有效!
解决方案:更新迭代器
void test_iterator_failure3() { vector<int> v; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); auto it = v.begin(); while (it != v.end()) { if (*it % 2 == 0) { //erase会返回删除之后pos位置的迭代器,更新新的迭代器即可 it=v.erase(it); } else { it++; } } }
- 与vector类似string在插入+扩容操作+erase之后,迭代器也会失效
void TestString()
{
string s("hello");
auto it = s.begin();
// 放开之后代码会崩溃,因为resize到20会string会进行扩容
// 扩容之后,it指向之前旧空间已经被释放了,该迭代器就失效了
// 后序打印时,再访问it指向的空间程序就会崩溃
//s.resize(20, '!');
while (it != s.end())
{
cout << *it;
++it;
}
cout << endl;
it = s.begin();
while (it != s.end())
{
it = s.erase(it);
// 按照下面方式写,运行时程序会崩溃,因为erase(it)之后
// it位置的迭代器就失效了
// s.erase(it);
++it;
}
}
面对这么多问题,我们只需要在使用迭代器时,牢记:在使用前, 对迭代器重新赋值即可,以insert或erase举例,使用insert或erase pos位置后,不要立即访问pos,一定要更新!
关于vector还有其他的接口我们通过查文档和做题的方式一步步熟悉!
会崩溃
//s.resize(20, ‘!’);
while (it != s.end())
{
cout << *it;
++it;
}
cout << endl;
it = s.begin();
while (it != s.end())
{
it = s.erase(it);
// 按照下面方式写,运行时程序会崩溃,因为erase(it)之后
// it位置的迭代器就失效了
// s.erase(it);
++it;
}
}
面对这么多问题,我们只需要在使用迭代器时,<font color='red'>牢记:在使用前, 对迭代器重新赋值</font>即可,以insert或erase举例,使用insert或erase pos位置后,不要立即访问pos,一定要更新!
<font color='pink'>关于vector还有其他的接口我们通过查文档和做题的方式一步步熟悉!</font>