[C++](11)vector的使用与模拟实现:迭代器失效,深浅拷贝详细剖析


vector 是表示可变大小数组的序列容器,就和我们之前写的顺序表差不多,使用起来和 string 差不多。

vector 的使用

vector 是类模板,使用时要指定类型。并且要包头文件 <vector>

构造

下面介绍 vector 实际使用的常见接口。

构造函数说明
vector()默认构造
vector(const vector& x)拷贝构造
vector(size_type n, const value_type& val = value_type())用n个元素构造一个容器。每个元素都是val的副本。
vector(InputIterator first, InputIterator last)迭代器区间初始化

①默认构造:

void test1()
{
	vector<int> v1; //存储int类型
	v1.push_back(1);
	v1.push_back(2);

	vector<double> v2; //存储double类型
	v2.push_back(1.1);
	v2.push_back(2.2);

	vector<string> v3; //存储string类型
	v3.push_back("张三"); //单参数的构造函数支持隐式类型转换
	v3.push_back("李四");
}

③④

void test2()
{
	vector<int> v4(10, 5);

	vector<int> v5(v4.begin(), v4.end());
}

遍历

void test3()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	//下标+[]
	for (size_t i = 0; i < v.size(); ++i)
	{
		cout << v[i] << " ";
	}
	cout << endl;
	//迭代器
	vector<int>::iterator it = v.begin();
	while (it != v.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	//范围for
	for (auto& e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

会 string 就会用 vector 使用方面没什么好讲的了。

容量

void test4()
{
	size_t sz;
	vector<int> foo;
	sz = foo.capacity();
	for (int i = 0; i < 100; ++i)
	{
		foo.push_back(i);
		if (sz != foo.capacity())
		{
			sz = foo.capacity();
			cout << "capacity changed:" << sz << endl;
		}
	}
}
//结果:
//capacity changed:1
//capacity changed:2
//capacity changed:3
//capacity changed:4
//capacity changed:6
//capacity changed:9
//capacity changed:13
//capacity changed:19
//capacity changed:28
//capacity changed:42
//capacity changed:63
//capacity changed:94
//capacity changed:141

由上看出vs下,是1.5倍扩容。

同样的代码放到Linux的g++下

[CegghnnoR@VM-4-13-centos 2022_7_3]$ ./a.out
capacity changed:1
capacity changed:2
capacity changed:4
capacity changed:8
capacity changed:16
capacity changed:32
capacity changed:64
capacity changed:128

Linux g++ 下是2倍扩容。

可以看出这两种版本各有权衡:

单次增容越多,同样是插入n个值,增容次数就越少,效率就越高,但是可能浪费的空间就越多。

如果你提前知道要开多少空间,当然也可以用 reserve 扩容

插入删除

vector 和 string 的区别就在于,vector 的 inserterase 只支持迭代器。

iterator insert(iterator position, const value_type& val); //single element (1)
    void insert(iterator position, size_type n, const value_type& val); //fill (2)
    void insert(iterator position, InputIterator first, InputIterator last); //range (3)
iterator erase (iterator position);
iterator erase (iterator first, iterator last);

例子:

void test5()
{
	vector<int> v1(10, 5);
	v1.insert(v1.begin() + 3, 2); //在下标为3的位置插入一个2
	v1.insert(v1.begin(), 2, 3); //在头部插入两个3
	vector<int> v2(10, 4);
	v1.insert(v1.begin(), ++v2.begin(), --v2.end()); //在头部插入v2去掉头和尾的部分
	v1.erase(v1.begin()); //头删
	v1.erase(v1.begin(), v1.end()); //全删,相当于clear
}

查找

vector 内部没有提供查找的成员函数,要查找需要 <algorithm> 里的 find

此函数模板的行为等效于:

template<class InputIterator, class T>
  InputIterator find (InputIterator first, InputIterator last, const T& val)
{
  while (first!=last) {
    if (*first==val) return first;
    ++first;
  }
  return last;
}

使用时只要传入要查找的范围的迭代器和要查找的值即可:

vector<int> v(10, 5);
vector<int>::iterator pos = find(v.begin(), v.end(), 5);
if (pos != v.end())
{
    cout << "找到了" << endl;
}
else
{
    cout << "没有找到" << endl;
}

模拟实现

框架

vector 是个类模板,有一个模板参数。成员变量 _start 指向第一个元素,_finish 指向最后一个元素的下一个位置,_endofstoage 指向空间的最后一个位置的下一个位置。

template<class T>
class Vector
{
public:
    typedef T* iterator;
	typedef const T* const_iterator;
private:
	iterator _start;
	iterator _finish;
	iterator _endofstorage;
};

默认构造和析构

Vector()
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{}

~Vector()
{
    if (_start)
    {
        delete[] _start;
        _start = _finish = _endofstorage = nullptr;
    }
}

迭代器

iterator begin()
{
    return _start;
}
iterator end()
{
    return _finish;
}
const_iterator begin() const
{
    return _start;
}
const_iterator end() const
{
    return _finish;
}

元素访问

T& operator[](size_t pos)
{
    assert(pos < size());
    return _start[pos];
}
const T& operator[](size_t pos) const
{
    assert(pos < size());
    return _start[pos];
}

容量

size_t size() const
{
	return _finish - _start;
}
size_t capacity() const
{
	return _endofstorage - _start;
}
void reserve(size_t n)
{
	size_t sz = size();
	if (n > capacity())
	{
		T* tmp = new T[n];
		if (_start)
		{
			for (size_t i = 0; i < size(); ++i) //此处涉及深浅拷贝
			{
				tmp[i] = _start[i];
			}
			delete[] _start;
		}
		_start = tmp;
	}
	_finish = _start + sz;
	_endofstorage = _start + n;
}

👆:for (size_t i = 0; i < size(); ++i){tmp[i] = _start[i];} 是将 vector 里的元素拷贝到新的空间里,注意不能写成memcpy(tmp, _start, size() * sizeof(T));

👆:错因分析:因为memcpy本身是浅拷贝,如果 vector 里的元素是 stringvector<int> 等涉及深拷贝的类型,那么使用 memcpy 只是拷贝了指针,新空间里的指针和旧空间里的指针指向同一块空间,接着 delete[] _start 释放旧空间的同时也把里面的元素所指向的空间一起释放了,新空间里的指针成了野指针。

👆:解决方法:使用赋值的方式进行深拷贝,赋值重载的实现在下面。


resize 还是分三种情况考虑:

void resize(size_t n, T val = T())
{
    if (n > capacity()) reserve(n);
    if (n > size())
        while (_finish < _start + n)
        {
            *_finish++ = val;
        }
    else _finish = _start + n;
}

👆:参数中 val 表示要初始化的值,默认为 T()。这是一个特性,如果T是内置类型,则相当于是值初始化,自定义类型则 T() 相当于匿名对象,会自动调用构造函数。

修改

push_back、pop_back

为了方便介绍迭代器失效问题,这里先把 push_backpop_back 实现出来,后续可以复用 inserterase

void push_back(const T& x)
{
    if (_finish == _endofstorage)
    {
        size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newCapacity);
    }

    *_finish = x;
    ++_finish;
}
void pop_back()
{
	if (_finish > _start) --_finish;
}

insert、迭代器失效(重点)

iterator insert(iterator pos, const T& x)
{
    assert(pos >= _start && pos <= _finish); //检查
    if (_finish == _endofstorage) //扩容
    {
        size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newCapacity);
    }
    for (iterator end = _finish; end > pos; --end) //挪数据
    {
        *end = *(end - 1);
    }
    *pos = x; //插入
    ++_finish;
    return pos;
}

insert 这样写会出现迭代器失效

测试:

void test2()
{
	Vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.insert(v.begin(), 0);
	for (auto& e : v)
	{
		cout << e << ' ';
	}
}
//结果:
//1 2 3 4 -842150451

👆:问题在于,插入第五个数据的时候会发生扩容,扩容后整个数组的存储位置全部转移,但是 pos 还指向着原来的空间,成为了野指针。也就是说:扩容以后,pos 就失效了

解决方法:在扩容前计算好相对位置,扩容后更新 pos

iterator insert(iterator pos, const T& x)
{
    assert(pos >= _start && pos <= _finish);
    if (_finish == _endofstorage)
    {
        size_t n = pos - _start; //防止迭代器失效
        size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
        reserve(newCapacity);
        pos = _start + n; //防止迭代器失效
    }
    for (iterator end = _finish; end > pos; --end)
    {
        *end = *(end - 1);
    }
    *pos = x;
    ++_finish;
    return pos;
}

但是问题还没有结束,我们在使用的时候依然有可能出现迭代器失效,

如下,我们想在每个偶数元素的前面插入一个20:

void test3()
{
	Vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
    //每个偶数元素前面插入一个20
	for (Vector<int>::iterator it = v.begin(); it != v.end(); ++it) //遍历
	{
		if (*it % 2 == 0) //判断偶数元素
		{
			v.insert(it, 20); //插入
            ++it; //此处要再++一次,保证指向的是原来的元素,而不是刚插入的元素。
		}
	}

	for (auto& e : v)
	{
		cout << e << ' ';
	}
}

👆:通过调试可以看出,第一个20成功插入,但是第二个20插入时被 assert 检查出来。因为第一次插入时发生了扩容,it 成为野指针,而后 for 循环遍历着一个不存在的数组。也就是说,扩容以后,it 失效了

正确的方式:

可以提前 reverse 开好空间防止扩容,但是更推荐接收 insert 的返回值来更新 it

void test3()
{
	Vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	for (Vector<int>::iterator it = v.begin(); it != v.end(); ++it)
	{
		if (*it % 2 == 0)
		{
			it = v.insert(it, 20); //it 接收返回值
			++it;
		}
	}

	for (auto& e : v)
	{
		cout << e << ' ';
	}
}
//结果:1 20 2 3 20 4

erase、clear

iterator erase(iterator pos)
{
    assert(pos >= _start && pos < _finish);
    for (iterator it = pos + 1; it != _finish; ++it)
    {
        *(it - 1) = *it;
    }
    --_finish;
    return pos;
}
void clear()
{
	_finish = _start;
}

拷贝构造、赋值重载

关于深浅拷贝的问题在[C++](10)C++的string类如何实现?中有详细讲解。vector 涉及资源管理,需要深拷贝。

为了方便,这里就直接使用现代写法,在这之前,还需要写一个有参的构造函数和一个类内的 swap 函数

因为传入的迭代器可能是各种类型,所以可以单独写一个函数模板。

template<class InputIterator>
Vector(InputIterator first, InputIterator last)
	: _start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	while (first != last)
	{
		push_back(*first++);
	}
}

void swap(Vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_endofstorage, v._endofstorage);
}

拷贝构造:

Vector(const Vector<T>& v)
	: _start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	Vector<T> tmp(v.begin(), v.end());
	swap(tmp);
}

赋值重载:

Vector<T>& operator=(Vector<T> v)
{
	swap(v);
	return *this;
}

👆:Vector<T>& operator=(Vector<T> v) 也可以写成 Vector& operator=(Vector v) 。但是这样有点怪,不推荐。

填充构造

Vector(int n, const T& val = T())
	: _start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	reserve(n);
	for (size_t i = 0; i < n; ++i)
	{
		push_back(val);
	}
}

注意:参数 int n,不要写成 size_t n

对于函数重载,编译器在调用函数时,会选择参数类型最匹配的进行调用。

如同一组实参,有多个重载的函数可以调用,则调用优先级为:类型完全匹配的函数 > 函数模板实例化 > 需要类型转换才能调用的函数

Vector<int> v(10, 5); 10是int 类型,要变成 size_t 类型需要类型转换。相比之下,迭代器范围构造是个函数模板,模板参数只有一个,函数参数两个,显然更加匹配,编译器则会去调用那个模板实例化的函数,从而导致错误。

完整代码

#pragma once
#include <iostream>
#include <cassert>
#include <cstring>
using namespace std;

template<class T>
class Vector
{
public:
	typedef T* iterator;
	typedef const T* const_iterator;
	Vector()
		:_start(nullptr)
		, _finish(nullptr)
		, _endofstorage(nullptr)
	{}

	template<class InputIterator>
	Vector(InputIterator first, InputIterator last)
		: _start(nullptr)
		, _finish(nullptr)
		, _endofstorage(nullptr)
	{
		while (first != last)
		{
			push_back(*first++);
		}
	}

	Vector(int n, const T& val = T())
		: _start(nullptr)
		, _finish(nullptr)
		, _endofstorage(nullptr)
	{
		reserve(n);
		for (size_t i = 0; i < n; ++i)
		{
			push_back(val);
		}
	}

	void swap(Vector<T>& v)
	{
		std::swap(_start, v._start);
		std::swap(_finish, v._finish);
		std::swap(_endofstorage, v._endofstorage);
	}

	Vector(const Vector<T>& v)
		: _start(nullptr)
		, _finish(nullptr)
		, _endofstorage(nullptr)
	{
		Vector<T> tmp(v.begin(), v.end());
		swap(tmp);
	}

	Vector<T>& operator=(Vector<T> v)
	{
		swap(v);
		return *this;
	}

	~Vector()
	{
		if (_start)
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}
	}

	iterator begin()
	{
		return _start;
	}
	iterator end()
	{
		return _finish;
	}
	const_iterator begin() const
	{
		return _start;
	}
	const_iterator end() const
	{
		return _finish;
	}

	size_t size() const
	{
		return _finish - _start;
	}
	size_t capacity() const
	{
		return _endofstorage - _start;
	}

	void reserve(size_t n)
	{
		size_t sz = size();
		if (n > capacity())
		{
			T* tmp = new T[n];
			if (_start)
			{
				for (size_t i = 0; i < size(); ++i)
				{
					tmp[i] = _start[i];
				}
				delete[] _start;
			}
			_start = tmp;
		}
		_finish = _start + sz;
		_endofstorage = _start + n;
	}

	void resize(size_t n, T val = T())
	{
		if (n > capacity()) reserve(n);
		if (n > size())
			while (_finish < _start + n)
			{
				*_finish++ = val;
			}
		else _finish = _start + n;
	}

	void push_back(const T& x)
	{
		//if (_finish == _endofstorage)
		//{
		//	size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
		//	reserve(newCapacity);
		//}

		//*_finish = x;
		//++_finish;
		insert(end(), x);
	}

	void pop_back()
	{
		//if (_finish > _start) --_finish;
		erase(end() - 1);
	}

	T& operator[](size_t pos)
	{
		assert(pos < size());
		return _start[pos];
	}
	const T& operator[](size_t pos) const
	{
		assert(pos < size());
		return _start[pos];
	}

	iterator insert(iterator pos, const T& x)
	{
		assert(pos >= _start && pos <= _finish);
		if (_finish == _endofstorage)
		{
			size_t n = pos - _start;
			size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
			reserve(newCapacity);
			pos = _start + n;
		}
		for (iterator end = _finish; end > pos; --end)
		{
			*end = *(end - 1);
		}
		*pos = x;
		++_finish;
		return pos;
	}

	iterator erase(iterator pos)
	{
		assert(pos >= _start && pos < _finish);
		for (iterator it = pos + 1; it != _finish; ++it)
		{
			*(it - 1) = *it;
		}
		--_finish;
		return pos;
	}

	void clear()
	{
		_finish = _start;
	}
private:
	iterator _start;
	iterator _finish;
	iterator _endofstorage;
};
  • 10
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

世真

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值