C++ vector类的模拟实现

最新推荐文章于 2024-08-08 17:06:25 发布

轻松学C语言

最新推荐文章于 2024-08-08 17:06:25 发布

阅读量161

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=Mzg2ODUxNzQxMw==&mid=2247490611&idx=2&sn=78cad8c02295e04529e925881821ebbe&chksm=ceaa4f79f9ddc66f5ef0bbc091dd3e2ca8ffc299b654521c166fd1e6e9a291376473124f0b16&scene=126&&sessionid=0

版权

本文详细介绍了C++标准库中的vector和string的实现原理，包括它们如何利用顺序表存储数据、迭代器的工作方式、以及各自的主要操作如构造函数、内存管理、元素插入和删除等。特别指出vector的动态扩容过程中可能出现的浅拷贝问题及其解决方案，强调在处理自定义类型时要注意深拷贝的使用。

摘要由CSDN通过智能技术生成

点击蓝字

关注我们

1.前言

vector和string虽然底层都是通过顺序表来实现的，但是他们利用顺序表的方式不同，string是指定好了类型，通过使用顺序表来存储并对数据进行操作，而vector是利用了C++中的泛型模板，可以存储任何类型的数据，并且在vector中，并没有什么有效字符和容量大小的说法，底层都是通过迭代器进行操作的，迭代器底层实现也就是指针，所以说，vector是利用指针对任何顺序表进行操作的。

2.vector属性

_start用于指向第一个有效元素
_finish用于指向最后一个有效元素的下一个位置
_endOfStorage用于指向已经开辟了的空间的最后一个位置的下一个位置
vector的迭代器是原生态T*迭代器

template<class T>
class Vector
{
public:
  typedef T* iterator;
  typedef const T* const_iterator;


private:
  iterator _start;
  iterator _finish;
  iterator _endOfStorage;
};

3.构造函数

无参默认构造函数，将所有属性都置空

以n个val初始化的构造函数，先开辟n个空间，再将这些空间的值都置为val，并更新_finish和_endOfStorage的位置

通过迭代器传参初始化的构造函数，使用新的迭代器，通过尾插将数据插入到新的空间

使用新的迭代器的原因是使传入的迭代器可以是任意类型的，如果使用Vector的迭代器，那么传入的迭代器的类型只能和Vector的类型一样，这里拿string举例，创建一个char类型的Vector，Vector，但是传入的迭代器并不是char类型的，可以是字符数组的迭代器或者是string的迭代器。只要通过解引用是char类型就可以

//无参默认构造
  Vector()
    :_start(nullptr)
    ,_finish(nullptr)
    ,_endOfStorage(nullptr)
  {}


  //n个val的构造函数
  Vector(int n, const T& val = T())
    :_start(new T[n])
    ,_finish(_start +n)
    ,_endOfStorage(_finish)
  {
    for (int i = 0; i < n; ++i)
    {
      _start[i] = val;
    }
  }


  //通过迭代器产生的构造函数
  template<class InputIterator>
  Vector(InputIterator first, InputIterator last)
    :_start(nullptr)
    , _finish(nullptr)
    , _endOfStorage(nullptr)
  {
    while (first != last)
    {
      pushBack(*first);
      ++first;
    }
  }

运行结果在begin() 和end()实现中

4.size()和capacity()

指针相减得到的值就是这两个指针之间的元素个数

size_t size() const
  {
    return _finish - _start;
  }


  size_t capacity() const
  {
    return _endOfStorage - _start;
  }

5.pushBack()

检查容量，如果_finish和_endOfStorage指针相等，说明容量已经满了，需要开辟更大的空间
在_finish位置插入新的数据
更新_finish

void pushBack(const T& val)
{
    //检查容量
    if (_finish == _endOfStorage)
    {
      size_t newC = _endOfStorage == nullptr ? 1 : 2 * capacity();
      reserve(newC);
    }


    //插入数据
    *_finish = val;
    //更新finish
    ++_finish
  }

运行结果在begin() 和end()实现中

6.reserve

检查n的合理性，reserve只能扩大不能缩小空间
保存有效元素的个数，用于后面更新_finish使用
申请空间并将数据拷贝到新的空间中，释放旧的空
更新3个成员变量，注意_finish不能更新为_finish+size()，原因是size()是通过两指针运算得出来的，此时的_fiinsh已经指向了释放的空间，再去使用会出错，所以这也是有第二步的原因

以下代码存在浅拷贝问题，文章末尾会给出正确深拷贝代码和详细解释

void reserve(size_t n)
{
    //reserve只能扩大空间不能缩小空间
    if (n > capacity())
    {
      //保存有效元素
      size_t sz = size();
      //申请空间
      T* tmp = new T[n];
      //将数据拷贝到新的空间
      if (_start != nullptr)
      {
        //拷贝有效元素
        memcpy(tmp, _start, sizeof(T) * size());
        delete[] _start;
      }
      //更新
      _start = tmp;
      _finish = _start + sz;
      _endOfStorage = _start + n;
    }
  }

运行结果在begin() 和end()实现中

7.begin() 和end()

iterator begin()
  {
    return _start;
  }


  iterator end()
  {
    return _finish;
  }


  const_iterator begin() const
  {
    return _start;
  }


  const_iterator end() const
  {
    return _finish;
  }

有了begin()和end就可以使用范围for

template<class T>
void printVectorFor(Vector<T>& vec)
{
  for (auto& e : vec)
  {
    cout << e;
  }
  cout << endl;
}

8.[]运算符重载

T& operator[](size_t pos)
  {
    assert(pos < size());
    return _start[pos];
  }


  const T& operator[](size_t pos) const
  {
    assert(pos < size());
    return _start[pos];
  }

9.resize()

n <= size 直接更新_finish的位置即可
size < n <= capacity，从_finish开始补充元素，补充到_start+n的位置，然后执行第一步
n > capacity 增容，执行第二和第一步

void resize(size_t n, const T& val = T())
{
    //3.n >= capacity
    if (n > capacity())
    {
      reserve(n);
    }
    //2.size < n <= capacity
    if (n > size())
    {
      while (_finish != _start + n)
      {
        *_finish = val;
        ++_finish;
      }
    }
    //1.n<=size
    _finish = _start + n;
  }

10.insert()

检查插入的位置的有效性[_start, _finish)
检查容量，由于增容会导致pos迭代器失效，所以我们可以先保存pos对于_start的偏移量offset，增容后，再将pos重新赋值pos=_start+offset
移动元素，从后往前移动，最后将pos位置的元素置为val
更新_finish

void insert(iterator pos, const T& val)
{
    //检查位置有效性
    assert(pos >= _start || pos < _finish);
    //检查容量
    if (_finish == _endOfStorage)
    {
      //增容会导致迭代器失效
      //保存pos和_start的偏移量
      size_t offset = pos - _start;
      size_t newC = _endOfStorage == nullptr ? 1 : 2 * capacity();
      reserve(newC);
      //更新pos
      pos = _start + offset;
    }
    //移动元素
    iterator end = _finish;
    while (end != pos)
    {
      *end = *(end - 1);
      --end;
    }
    //插入
    *pos = val;
    //更新
    ++_finish;
  }

11.erase()

检查位置有效性
移动元素，从前向后移动
更新_finish

iterator erase(iterator pos)
{
    //检查位置有效性
    assert(pos >= _start || pos < _finish);
    //移动元素，从前往后
    iterator start = pos + 1;


    while (start != _finish)
    {
      *(start - 1) = *start;
      ++start;
    }
    //更新
    --_finish;
  }

12.void popBack()

利用erase接口进行尾删

void popBack()
  {
    if (size() > 0)
      erase(end() - 1);
  }

13.析构函数

~Vector()
  {
    if (_start)
    {
      delete[] _start;
      _start = _finish = _endOfStorage = nullptr;
    }
  }

14.算法库中的find

头文件<algorithm>

template <class InputIterator, class T>
   InputIterator find (InputIterator first, InputIterator last, const T& val)

参数内容(从迭代器的begin起到end中，找到val值，找到返回该值所在的迭代器，找不到返回end)

15.reserve的深浅拷贝问题

当我门使用自定义类型时，使用浅拷贝是效率最高的，但是当我们使用自定义类型时，并且存在内存资源的利用，就必须时刻注意存在的深浅拷贝问题。来看以下代码测试

void test()
{
  Vector<string> v;
  string str1 = "123";
  string str2 = "456";
  string str3 = "789";
  v.pushBack(str1);
  v.pushBack(str2);
  v.pushBack(str3);
}

调试结果：

当我们在插入第三个字符串时，就发生了内存异常的问题，我们来看看到底是什么问题。
第一次插入str1，没有问题

第二次插入str2，插入之前我们会扩容，会创建2倍大的空间tmp，然后通过memcpy内存拷贝(浅拷贝)将内容拷贝到tmp中，此时就有两个指向指向一个资源(123)，拷贝完后delete[]要删除原有空间，将123释放后，其实现在新的空间的第一个元素指向的是一个已经释放了的空间，但是问题并没有暴露出来，第二个元素的插入也没有问题

第三次str3的插入，这次插入也会进行扩容，会先开辟一个2倍大的空间tmp，然后通过memcpy内存拷贝(浅拷贝)将内容拷贝到tmp中，此时有两个指针指向已经释放的资源（123），有两个指针指向资源（456），当拷贝完成后会释放旧的空间，当释放原指针指向的（456）时不会报错，原因和第二次插入原因一样。但是释放原有空的第一个指针时，就会发生内存报错异常，原因是资源（123）已经被释放了，如果再释放就属于二次释放，是不安全的。内存错误就报异常。

所以我们在扩容的时候不应该只是单纯的浅拷贝，也就是使用memcpy来拷贝内容，我们应该要使用深拷贝。将memcpy改为for (size_t i = 0; i < sz; ++i){tmp[i] = _start[i];}
整体代码如下：

void reserve(size_t n)
{
    //reserve只能扩大空间不能缩小空间
    if (n > capacity())
    {
      //保存有效元素
      size_t sz = size();
      //申请空间
      T* tmp = new T[n];
      //将数据拷贝到新的空间
      if (_start != nullptr)
      {
        //拷贝有效元素
        //memcpy(tmp, _start, sizeof(T) * size());
        //深拷贝
        for (size_t i = 0; i < sz; ++i)
        {
          //调用自定义类型的赋值运算符重载函数，完成深拷贝
          //前提是该重载函数也是深拷贝，string是STL库中，是被深拷贝处理过
          tmp[i] = _start[i];
        }
        delete[] _start;
      }
      //更新
      _start = tmp;
      _finish = _start + sz;
      _endOfStorage = _start + n;
    }
  }

如果你年满18周岁以上，又觉得学【C语言】太难？想尝试其他编程语言，那么我推荐你学Python，现有价值499元Python零基础课程限时免费领取，限10个名额！

▲扫描二维码-免费领取

戳“阅读原文”我们一起进步

轻松学C语言

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
C++ vector类的模拟实现

点击蓝字关注我们1.前言vector和string虽然底层都是通过顺序表来实现的，但是他们利用顺序表的方式不同，string是指定好了类型，通过使用顺序表来存储并对数据进行操作，而vector是利用了C++中的泛型模板，可以存储任何类型的数据，并且在vector中，并没有什么有效字符和容量大小的说法，底层都是通过迭代器进行操作的，迭代器底层实现也就是指针，所以说，vector是利用指针对任何顺序表...
复制链接

扫一扫