在实现vector中遇到的一些问题及优化

王红花x

已于 2024-05-27 19:33:07 修改

阅读量613

点赞数 12

分类专栏： C++ 文章标签： c++ 学习

于 2024-05-27 19:32:54 首次发布

本文链接：https://blog.csdn.net/qq_62319705/article/details/139238014

版权

C++ 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

五、直接改变_finish会导致内存泄漏问题

一、模拟实现的vector源码

话不多说，献上源码，记得看注释呀！

#pragma once

namespace sjx
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		vector() :_start(nullptr), _finish(nullptr), _endOfStorage(nullptr) {}
		vector(size_t n, const T& val = T()) :_start(nullptr), _finish(nullptr), _endOfStorage(nullptr)
		{
			// 这个构造函数目前有一点问题，以我目前的能力暂时无法很好的解决
			// vector<int> v(5, 2);
			// 上述代码的本意是构造含有5个2的vector<int>对象
			// 但实际上，运行时会调用vector(InputIterator first, InputIterator last)
			// 这个迭代器构造
			reserve(n);
			for (int i = 0; i < n; ++i)
			{
				push_back(val);
			}
		}
		template<class InputIterator>
		vector(InputIterator first, InputIterator last) :_start(nullptr), _finish(nullptr), _endOfStorage(nullptr)
		{
			assert(first <= last);
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}
		vector(const vector& x) :_start(nullptr), _finish(nullptr), _endOfStorage(nullptr)
		{
			// 拷贝构造，先用x的内容调用迭代器构造构造出v
			// 再将this和v的内容交换
			vector<T> v(x.begin(), x.end());
			swap(v);
		}
		~vector()
		{
			delete[] _start;
			_start = _finish = _endOfStorage = nullptr;
		}
		vector<T>& operator=(vector<T> x)
		{
			// 下面写了一大堆，不如直接叫一个打工人来打工
			// 因为参数x是传值拷贝，因此直接交换就可以
			// 有一些极少数情况：v1 = v1，两个相同的对象赋值
			// 这种情况下也不会出错，因此就忽略不讨论了。
			swap(x);

			//if (x._start == nullptr)
			//{
			//	// 赋值运算符重载，需要考虑释放原空间
			//	delete[] _start;
			//	_start = _finish = _endOfStorage = nullptr;
			//}
			//else if (this != &x) // 如果两个操作数相等，直接返回。
			//{
			//	delete[] _start;
			//	reserve(x.capacity());
			//	memcpy(_start, x._start, sizeof(T) * x.size());
			//	_finish = _start + x.size();
			//	_endOfStorage = _start + x.capacity();
			//}
			return *this;
		}

		// Iterators:
		iterator begin()
		{
			return _start;
		}
		const_iterator begin() const
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator end() const
		{
			return _finish;
		}

		// Capacity:
		size_t size() const
		{
			return size_t(_finish - _start);
		}
		void resize(size_t n, const T& val = T())
		{
			// 如果n小于size()，就说明要删除数据，反之，就要在后面添加
			if (n < size())
			{
				erase(begin() + n, end());
			}
			else
			{
				insert(end(), n - size(), val);
			}
		}
		size_t capacity() const
		{
			return size_t(_endOfStorage - _start);
		}
		bool empty() const
		{
			return begin() == end();
		}
		void reserve(size_t n)
		{
			// 新容量大于现有容量才扩容
			if (n > capacity())
			{
				iterator tmp = new T[n];
				size_t oldSize = size();
				// 如果_start不为空，需要把旧数据移动到新空间
				if (_start)
				{
					// memcpy对自定义类型其实并不会很好的适用
					// 例如，vector<string>类型扩容，如果直接内存拷贝
					// 拷贝的其实是string的成员变量，也就是指针
					// 但拷贝完之后要释放原内存空间，也就是要delete[] _start
					// 对于string类型，会调用它的析构函数，对指针指向的空间也要释放
					// 导致新开辟的空间中拷贝过来的string成员变量的指针变成野指针
					// memcpy(tmp, _start, sizeof(T) * oldSize);
					
					for (size_t i = 0; i < oldSize; ++i)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}
				_start = tmp;
				_finish = _start + oldSize;
				_endOfStorage = _start + n;
			}
		}

		// Element access:
		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}
		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}

		// Modifiers:
		void push_back(const T& val)
 		{
			if (_finish == _endOfStorage)
			{
				size_t newCapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newCapacity);
			}

			*_finish = val;
			++_finish;
		}
		void pop_back()
		{
			assert(!empty());
			--_finish;
		}
		iterator insert(iterator pos, const T& val)
		{
			assert(pos >= begin() && pos <= end());

			// 如果发生扩容，pos就不再适用，需要记录相对位置
			int n = pos - begin();
			if (_finish == _endOfStorage)
			{
				size_t newCapacity = _start ? capacity() * 2 : 4;
				reserve(newCapacity);
			}
			pos = begin() + n;
			iterator it = end();
			++_finish;
			while (it != pos)
			{
				*it = *(it - 1);
				--it;
			}
			*it = val;
			return it;
		}
		void insert(iterator pos, size_t n, const T& val)
		{
			assert(pos >= begin() && pos <= end());

			// 如果发生扩容，pos就不再适用，需要记录相对位置
			int i = pos - begin();
			if (_finish + n > _endOfStorage)
			{
				size_t newCapacity = _start ? capacity() * 2 : 4;
				if (size() + n > newCapacity)
				{
					newCapacity = size() + n;
				}
				reserve(newCapacity);
			}
			pos = begin() + i;

			_finish += n;
			iterator it = end() - 1;
			// 先把数据移到后面
			while (it != pos + n - 1)
			{
				*it = *(it - n);
				--it;
			}
			// 再填入n个val
			while (it >= pos)
			{
				*it = val;
				--it;
			}
		}
		iterator erase(iterator pos)
		{
			assert(pos >= begin() && pos < end());
			iterator old_pos = pos;
			// 这里有一个问题，假如T是string类型，那么内存拷贝直接覆盖pos位置的数据后
			// pos位置原来指向一块字符串的地址就会丢失，这块字符串无法释放，是否会导致
			// 内存泄漏？
			// memcpy(pos, pos + 1, sizeof(T) * (end() - pos - 1));
			// 因此采用下面的赋值方式
			while (pos + 1 != end())
			{
				*pos = *(pos + 1);
				++pos;
			}
			// 这个--_finish仍会有上述的问题，待之后学得更多，回来再讨论
			--_finish;
			return old_pos;
		}
		iterator erase(iterator first, iterator last)
		{
			assert(first >= begin() && first < end());
			assert(last >= begin() && last <= end());
			assert(first <= last);

			int i = 0;
			for (; last != end(); ++i)
			{
				*(first + i) = *last;
				++last;
			}
			_finish = first + i;
			return first;
		}
		void swap(vector<T>& x)
		{
			std::swap(x._start, _start);
			std::swap(x._finish, _finish);
			std::swap(x._endOfStorage, _endOfStorage);
		}
		void clear()
		{
			_finish = _start;
		}

	private:
		iterator _start; // 数据的开始位置
		iterator _finish; // 最后一个数据的下一个位置
		iterator _endOfStorage; // 最后一个存储空间的下一个位置
	};
}

二、拷贝构造函数和赋值运算符重载优化

当我们实现了迭代器构造函数后，我们就可以简化很多其他函数，例如：拷贝构造函数和赋值运算符重载。

对于拷贝构造函数来说，一般是将传入的对象的值赋给当前对象，如果涉及到了深拷贝，就需要考虑更多，比如新开辟空间，数据拷贝。对此，我们可以用传入的对象，结合已经实现的迭代器构造函数，构造出一个新的对象（称之为打工仔），让这个打工仔的成员变量的值直接和当前对象的成员变量的值交换。

因为打工仔是用传入的对象构造的，因此打工仔的数据和传入的对象是一样的，且是深拷贝过的。因而将两个对象的成员变量交换后，当前对象也就和传入对象的数据一样了，且是深拷贝过的。而打工仔中存的就是当前对象之前的值，也就是nullptr，拷贝构造结束后，打工仔因为函数结束要销毁，也就相当于释放nullptr，当然不会报错。赋值运算符重载也是同理。

对于以上的模式，适用于各种类对象的拷贝构造函数和赋值运算符重载。

三、构造函数发现的问题

正如注释中所说的，我是知道问题出在哪里的，在用vector<int> v(5, 2)时，传入的两个参数都默认是int类型，但是因为int和size_t并不完全匹配，因此迭代器构造函数会生成一个模板，InputIterator被解释为int类型，导致和理想结果不同，发生错误。

但是在标准库中的vector，这样调用确实没有问题，有知道解决问题的大佬们可以在评论区下留言，在后续学习的过程中如果我可以解决这类问题，我会及时发文更正！

四、扩容时需要考虑深拷贝问题

假如有一个vector<vector<int>>的对象要扩容，我们可以看如下示例图：

因此，一般采用给每个对象赋值的形式，将旧空间的内容赋给新空间，而不是直接内存拷贝。

比如让原来存储空间中的第一个对象调用拷贝构造赋值给新空间中第一个对象。

五、直接改变_finish会导致内存泄漏问题

假设有一个vector<string>类型的对象vstring中含有10个对象，调用clear函数后，_finish会和_start相等。假如此时，我们又调用push_back插入一个string对象，那么之前应该在这个位置的string对象内容会被覆盖，但之前string对象所指向的数据空间似乎并没有被释放。

但是这部分数据空间因为原string对象的指针被覆盖，导致没有指针指向这部分空间，应该是会导致内存泄漏的。

对于此问题，我的想法是在_finish改变时，调用该对象的析构函数完成清理工作，