【C++】vector及其简单实现

最新推荐文章于 2024-08-14 11:42:29 发布

何陈陈

最新推荐文章于 2024-08-14 11:42:29 发布

阅读量1.3k

点赞数 29

分类专栏： C++ 文章标签： c++ 开发语言

本文链接：https://blog.csdn.net/2301_77438812/article/details/140834852

版权

C++ 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

5 .vector 迭代器失效问题。（重点）

Ⅰ、vector的介绍

1. vector 是表示可变大小数组的序列容器。

2. 就像数组一样， vector 也采用的连续存储空间来存储元素。也就是意味着可以采用下标对 vector 的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

3. 本质讲， vector 使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。

4. vector 分配空间策略： vector 会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。

5. 因此， vector 占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。

6. 与其它动态序列容器相比（ deque, list and forward_list ）， vector 在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起list 和 forward_list统一的迭代器和引用更好。

Ⅱ、vector的模拟实现

1 .vector构造

模拟实现：

// construct and destroy
vector()
:_start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{}
// v2(v1)
vector(const vector<T>& v)
{
reserve(v.capacity());
for (auto& e : v)
{
push_back(e);
}
}

// vector<int> v1 = { 1,2,3,4,5,6,7,8,9,10 };

vector(initializer_list<T> il)
{
reserve(il.size());
for (auto& e : il)
{
push_back(e);
}
}

// 类模板的成员函数可以是函数模板

// 若使用iterator做迭代器，会导致初始化的迭代器区间[first,last)只能是vector的迭代器

// 重新声明迭代器，迭代器区间[first,last)可以是任意容器的迭代器

template <class InputIterator>
vector(InputIterator first, InputIterator last)
{
while (first != last)
{
push_back(*first);
++first;
}
}

vector(size_t n, const T& val = T())
{
reserve(n);
for (size_t i = 0; i < n; i++)
{
push_back(val);
}
}

/*

* 理论上讲，提供了vector(size_t n, const T& value = T())之后

* vector(int n, const T& value = T())就不需要提供了，但是对于：

* vector<int> v(10, 5);

* 编译器在编译时，认为T已经被实例化为int，而10和5编译器会默认其为int类型

* 就不会走vector(size_t n, const T& value = T())这个构造方法，

* 最终选择的是：vector(InputIterator first, InputIterator last)

* 因为编译器觉得区间构造两个参数类型一致，因此编译器就会将InputIterator实例化为int

* 但是10和5根本不是一个区间，编译时就报错了

* 故需要增加该构造方法

*/

vector(int n, const T& val = T())
{
reserve(n);
for (int i = 0; i < n; i++)
{
push_back(val);
}
}

2 .vector iterator

    // Vector的迭代器是一个原生指针

    typedef T* iterator；

    typedef const T* const_iterator；

    iterator begin()

    {

      return _start;

    }

    iterator end()

    {

      return _finish;//指向最后一个有效数据的下一个位置

    }

    const_iterator cbegin()const

    {

      return _start;

    }

    const_iterator cend() const

    {

      return _finish;

    }

3 . vector 空间增长

模拟实现：

size_t size() const
{
   return _finish - _start;
}

const T& operator[](size_t pos) const
{
   assert(pos < size());

   return _start[pos];
}

size_t capacity() const
{
   return _endofstorage - _start;
}

void reserve(size_t n)
{
   if (n > capacity())
   {
       T* tmp = new T[n];
       size_t old_size = size();
       //memcpy(tmp, _start, size() * sizeof(T));//这里不能用memcpy，他是浅拷贝
       for (size_t i = 0; i < old_size; i++)
       {
           tmp[i] = _start[i];
       }
       delete[] _start;

       _start = tmp;
       _finish = tmp + old_size;
       _endofstorage = tmp + n;
   }
}

void resize(size_t n, const T& val = T())
{
   if (n > size())
   {
       reserve(n);
       // 插入
       while (_finish < _start + n)
       {
           *_finish = val;
           ++_finish;
       }
   }
   else
   {
       // 删除
       _finish = _start + n;
   }
}

注意：

1.capacity 的代码在 vs 和 g++ 下分别运行会发现， vs 下 capacity 是按 1.5 倍增长的， g++ 是按 2 倍增长的 。不能固化的认为，vector 增容都是 2 倍，具体增长多少是根据具体的需求定义的。vs 是 PJ 版本 STL ， g++ 是 SGI 版本 STL 。

2.reserve 只负责开辟空间，如果确定知道需要用多少空间， reserve 可以缓解 vector 增容的代价缺陷问题。

3.resize 在开空间的同时还会进行初始化，影响 size 。

下面代码可以测试编译器的扩容机制：

// 测试 vector 的默认扩容机制

void TestVectorExpand ()

{

        size_t sz ;

        vector < int > v ;

        sz = v . capacity ();

        cout << "making v grow:\n" ;

        for ( int i = 0 ; i < 100 ; ++ i )

        {

                v . push_back ( i );

                if ( sz != v . capacity ())

                {

                        sz = v . capacity ();

                        cout << "capacity changed: " << sz << '\n' ;

                }

        }

}

提醒：

如果已经确定 vector 中要存储元素大概个数，可以提前将空间设置足够

就可以避免边插入边扩容导致效率低下的问题了

提前将容量设置好，可以避免一遍插入一遍扩容

4 . vector 增删查改

模拟实现：

void push_back(const T& val)
{
   insert(end(), val);
}

void pop_back()
{
   /*assert(!empty());

   --_finish;*/

   erase(end() - 1);
}

T& operator[](size_t pos)
{
   assert(pos < size());

   return _start[pos];
}

void swap(vector<T>& v)//swap是成员函数，他可以访问v的私有成员
{
   std::swap(_start, v._start);
   std::swap(_finish, v._finish);
   std::swap(_endofstorage, v._endofstorage);
}

void insert(iterator pos, const T& val)
{
   assert(pos >= _start);
   assert(pos <= _finish);

   if (_finish == _endofstorage)
   {
       size_t len = pos - _start;
       reserve(capacity() == 0 ? 4 : capacity() * 2);

       // 如果扩容了要更新pos
       pos = _start + len;
   }

   iterator it = _finish - 1;
   while (it >= pos)
   {
       *(it + 1) = *it;
       --it;
   }
   *pos = val;
   ++_finish;
}

iterator erase(iterator pos)
{
   assert(pos >= _start);
   assert(pos < _finish);

   iterator it = pos + 1;
   while (it < _finish)
   {
       *(it - 1) = *it;
       ++it;
   }

   --_finish;

   return pos;
}

5 .vector 迭代器失效问题。（重点）

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了 封装，比如： vector 的迭代器就是原生态指针 T* 。因此 迭代器失效，实际就是 迭代器底层对应指针所指向的空间被销毁 了，而使用一块已经被释放的空间 ，造成的后果是程序崩溃 ( 即 如果继续使用已经失效的迭代器， 程序可能会崩溃 )

对于 vector 可能会导致其迭代器失效的操作有：

1. 会引起其底层空间改变的操作，都有可能是迭代器失效 ，比如： resize 、 reserve 、 insert 、 assign 、push_back等。

#include <iostream>
using namespace std;
#include <vector>
int main()
{
   vector<int> v{ 1,2,3,4,5,6 };

   auto it = v.begin();

   // 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容
   // v.resize(100, 8);

   // reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变
   // v.reserve(100);

   // 插入元素期间，可能会引起扩容，而导致原空间被释放
   // v.insert(v.begin(), 0);
   // v.push_back(8);

   // 给vector重新赋值，可能会引起底层容量改变
   v.assign(100, 8);

   /*
   出错原因：以上操作，都有可能会导致vector扩容，也就是说vector底层原理旧空间被释放掉，而在打印时，it还使用的是释放之间的旧空间，在对it迭代器操作时，实际操作的是一块已经被释放的空间，而引起代码运行时崩溃。

   解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，只需给it重新赋值即可。
   */
   while (it != v.end())
   {
       cout << *it << " ";
       ++it;
   }
   cout << endl;
   return 0;
}

2. 指定位置元素的删除操作 - -erase

#include <iostream>
using namespace std;
#include <vector>
int main()
{
   int a[] = { 1, 2, 3, 4 };
   vector<int> v(a, a + sizeof(a) / sizeof(int));
   // 使用find查找3所在位置的iterator
   vector<int>::iterator pos = find(v.begin(), v.end(), 3);
   // 删除pos位置的数据，导致pos迭代器失效。
   v.erase(pos);
   cout << *pos << endl; // 此处会导致非法访问
   return 0;
}

erase 删除 pos 位置元素后， pos 位置之后的元素会往前搬移，没有导致底层空间的改变，理论上讲迭代器不应该会失效但是：如果pos 刚好是最后一个元素，删完之后 pos 刚好是 end 的位置，而 end 位置是没有元素的，那么pos 就失效了。因此删除 vector 中任意位置上元素时， vs 就认为该位置迭代器失效了。

#include <iostream>
using namespace std;
#include <vector>
int main()
{
   vector<int> v{ 1, 2, 3, 4 };
   auto it = v.begin();
   while (it != v.end())
   {
       if (*it % 2 == 0)
           v.erase(it);
       ++it;
   }

   return 0;
}
int main()
{
   vector<int> v{ 1, 2, 3, 4 };
   auto it = v.begin();
   while (it != v.end())
   {

        if (*it % 2 == 0)
        it = v.erase(it);
        else
        ++it;
}
      return 0;
}

3. 注意： Linux 下， g++ 编译器对迭代器失效的检测并不是非常严格，处理也没有 vs 下极端。

SGI STL 中，迭代器失效后，代码并不一定会崩溃，但是运行结果肯定不

对，如果 it 不在 begin 和 end 范围内，肯定会崩溃的。

4. 与 vector 类似， string 在插入 + 扩容操作 +erase 之后，迭代器也会失效

#include <string>
void TestString()
{
   string s("hello");
   auto it = s.begin();
   // 放开之后代码会崩溃，因为resize到20会string会进行扩容
   // 扩容之后，it指向之前旧空间已经被释放了，该迭代器就失效了
   // 后序打印时，再访问it指向的空间程序就会崩溃
   //s.resize(20, '!');
   while (it != s.end())
   {
       cout << *it;
       ++it;
   }
   cout << endl;
   it = s.begin();
   while (it != s.end())
   {
       it = s.erase(it);
       // 按照下面方式写，运行时程序会崩溃，因为erase(it)之后
       // it位置的迭代器就失效了
       // s.erase(it);
       ++it;
   }
}