模拟实现vector

最新推荐文章于 2023-04-02 23:58:22 发布

dhdw

最新推荐文章于 2023-04-02 23:58:22 发布

阅读量263

点赞数

分类专栏： C++学习笔记文章标签： c++ vector 迭代器失效

本文链接：https://blog.csdn.net/m0_63445149/article/details/126823198

版权

C++学习笔记专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一：vector的成员变量与迭代器

我们知道vector里面可以存各种数据类型，所以必定会用到模板，假设vector的模板参数为T，那么T*这个指针封装后就是vector的迭代器
和string的迭代器很像，只不过string确定存的是字符，所以迭代器直接是char的指针，而vector存的数据类型不确定，就使用T的指针
而vector的3个成员变量_start,_finish,_endofstorage也就是3个迭代器，分别指向vector的开头，vector有效数据的结尾，vector容量的结尾

template <class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;
		iterator begin()
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator begin() const
		{
			return _start;
		}
		const_iterator end() const
		{
			return _finish;
		}
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};

根据这3个迭代器，我们就能轻松的得出vector的size和capacity，就是用_finish和_endofstorage分别与_start相减
operator[]就更简单了，和我们使用一维数组时一样，直接返回_start[pos]
当_start==_finish，我们就能确定vector目前为空

size_t size() const
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _endofstorage - _start;
		}
		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}
		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}
		bool empty() const
		{
			return _start == _finish;
		}

二：vector的构造与析构

普通的构造和析构很简单，不用多说
主要关注支持迭代器的构造函数，我们需要重新搞一个迭代器，因为如果直接用之前封装的iterator当参数，那么只支持传vector的迭代器构造
我们换成模板参数后，则可以支持任意容器的迭代器来构造vector

		vector()
		{
			_start = nullptr;
			_finish = nullptr;
			_endofstorage = nullptr;
		}
		~vector()
		{
			if (_start)
			{
				delete[] _start;
			}
			_start = _finish = _endofstorage;
		}

	template <class InputIterator>
	vector(InputIterator first, InputIterator end)
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			while (first != end)
			{
				push_back(*first);
				first++;
			}
		}

三：reserve与resize

1.reverse

vector当容量不足时需要扩容，reserve的重要性不言而喻，后面的insert,push_back,拷贝构造都需要用到，但是编写代码时却很容易出错
大家应该都能想到，先判断传入的参数是否大于目前容量，大于则进行扩容，即申请一块新的空间，将旧的空间数据拷贝过去，然后释放旧空间，最后更新3个成员变量的指向
最容易错的地方就是将旧空间的数据拷贝到新空间的这一步
我们通常会想到memcpy，方便快捷，还是内存拷贝，不用担心数据类型，似乎毫无问题，但其实有着重大的隐患
如果vector中存的是内置类型，比如int,char那么没有什么问题，但是要是存的是string，问题就来了
memcpy直接拷贝了string的_str,_size,_capacity，而_str指向了一片堆上的空间，这就变成了浅拷贝，完成拷贝后，我们释放旧空间，编译器也会调用string的析构函数释放其指向的空间
那我们新空间的_str就成了野指针，指向了一片未知空间，最后vector使用完毕调用析构函数时，就会再次释放_str指向的空间，而此时这片空间已经被释放过了，不再是堆上分配来的空间，我们无权释放，硬性释放会导致我们的程序崩溃
解决方法就是不使用memcpy，而是遍历使用=操作符进行赋值，对于string，编译器会调用string的operator=完成深拷贝，就可以避免上述问题

	void reserve(size_t n)
	{
		size_t len = size();
		if (n > capacity())
		{
			T* tmp = new T[n];
			if (_start)//_start不为空指针
			{
				//禁止使用memcpy，对于需要深拷贝的对象会出问题
				//比如vector<string>
				for (int i = 0; i < len; i++)
				{
					tmp[i] = _start[i];//string的operator=
				}
				delete[] _start;
			}
			_start = tmp;
			_finish = _start + len;
			_endofstorage = _start + n;
		}
	}

2.resize

相比于reverse，resize就要简单许多
需要注意的是T类型的参数如何进行缺省，const T& val = T(),利用T类型的自己的构造函数构造一个匿名对象作为缺省值
当n小于vector容量时，直接修改_finish
当n大于vector容量时，扩容后将val拷贝进去

void resize(size_t n, const T& val = T())
	{
		if (n <= size())
		{
			_finish = _start + n;
		}
		else
		{
			if (n > capacity())
			{
				reserve(n);
			}
			while (_finish < _start + n)
			{
				*_finish = val;
				_finish++;
			}
		}
	}

四：拷贝构造与operator=

1. 拷贝构造

进行拷贝构造时我们也容易使用memcpy进行拷贝，也会造成和reserve一样的问题
所以我们可以用另一种巧妙的方式避免浅拷贝，那就是遍历要拷贝的vector，将其中每一个数据push_back进新的vector中
而push_back是通过_finish=x进行赋值的，会调用相应类型的operator=，而完成深拷贝
还有一个细节就是，我们遍历进行push_back之前需要先对新的vector进行reserve保证两个vector最终容量一直
如果直接push-back，可能新的vector容量只有原vector的size的大小，造成容量不一致

		vector(const vector<T>& v)
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(v.capacity()); //直接push_back的话capacity可能不一样大
			for (auto e : v)
			{
				push_back(e);
			}
			/*_start = new T[v.capacity()];
			memcpy(_start, v._start, sizeof(T) * v.size());
			_endofstorage = _start + v.capacity();
			_finish = _start + v.size();*/
		}

2.operator=

operator=的编写可以参考Date类的operator=
关键就是传参是不传引用，使其传参时完成一次拷贝构造，然后把这个完成拷贝构造后的vector和目前的vector进行交换

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}
		vector<T>& operator=(vector<T> v)
		{
			swap(v);
			return *this;
		}

五: 插入与删除

1.push_back

push_back要注意的是vector可能为空或者容量不足，我们需要先进行扩容后，再进行插入

	void push_back(const T& x)
	{
		if (_finish == _endofstorage)
		{
			size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
			reserve(newcapacity);
		}
		*_finish = x;
		_finish++;
	}

2.pop_back

pop_back我们也不用真删，修改_finish的值即可，前提是vector不为空，为空就不能再删了

void pop_back()
		{
			assert(!empty());
			_finish--;
		}

3.insert

insert注意插入的位置不能超过_finish，因为insert是在pos位置的后面插入，所以pos最多到_finish-1
与push_back相同，insert也要先检查容量，容量不足时扩容后才能进行插入
当扩容后，pos迭代器失效，因为此时pos还指向之前旧空间的位置，我们需要更新pos才能正常进行插入
插入时需要把pos以后的数据往后移动，所以insert是个O(n)的接口，不推荐频繁使用

	iterator insert(iterator pos, const T& x)
		{
			assert(pos < _finish);
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;
				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				end--;
			}
			*pos = x;
			_finish++;
			return pos;
		}

4.erase

要删除的位置要小于_finish，_finish没有存数据，所以pos最多到_finish-1
同样erase也是时间为O（n）的接口，不推荐频繁使用

		iterator erase(iterator pos)
		{
			assert(pos < _finish);
			iterator it = pos + 1;
			while (it != _finish)
			{
				*(it - 1) = *it;
				it++;
			}
			_finish--;
			return pos;
		}

5.插入和删除导致的迭代器失效

reserve,resize,insert,push_back会造成vector扩容的操作，都会让vector的迭代器失效
根本原因是扩容时vector已经有了新的空间，而迭代器还在指向被释放了旧空间造成
erase同样可能导致迭代器失效，按理来说，删除pos位置元素，之后的元素会往前移，迭代器应该不会失效，但是尾删时，迭代器会指向_finish位置，而-finish位置是没有元素的，此时也认为迭代器失效了
如何解决？
使用前，对迭代器重新赋值即可