vector的模拟实现

最新推荐文章于 2024-07-03 16:17:13 发布

dbln

最新推荐文章于 2024-07-03 16:17:13 发布

阅读量599

点赞数 5

分类专栏： C++ 文章标签：开发语言

本文链接：https://blog.csdn.net/zdlynj/article/details/131861570

版权

C++ 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

一、vector类

1、 vector是表示可变大小数组的序列容器。

2、就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

3、本质讲，vector使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。

4、 vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。

上面的图片来自于《STL源码剖析》这本书。从图中我们就可以看出vector实现的基本形式。vector类的成员变量是三个指针。指向起始位置的 _start ，指向最后一个数据的下一个位置的_finish，指向容量的下一个位置的_end_of_storage。

下面的代码就是vector类实现的基本框架

template<class T>
class vector
{
    typedef T* iterator;
	typedef const T* const_iterator;

private:
//三者均为指针
    iterator _start;
	iterator _finish;//最后一个数据的下一个位置
	iterator _end_of_storage;//容量的下一个位置
};

二、构造函数及析构函数

1、构造函数

将三个指针全都置成空。

vector()
	:_start(nullptr)
    , _finish(nullptr)
	, _end_of_storage(nullptr)
{}

2、析构函数

delete掉 _start的空间，将三者置成nullptr。

~vector()
{
	delete[] _start;
	_start = _finish = _end_of_storage = nullptr;
}

三、vector的迭代器

vector的迭代器是一个指针。并分为 iterator 和 const_iterator两种类型，非const 对象调用前者，const对象调用后者。

typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

const_iterator begin()const
{
	return _start;
}

const_iterator end()const
{
	return _finish;
}

四、vector空间增长问题

1、size

获取数据个数

size_t size()const
{
	return _finish - _start;
}

2、capacity

获取容量大小

size_t capacity()const
{
	return _end_of_storage - _start;
}

3、empty

判断是否为空

bool empty()const
{
	return size() == 0;
}

4、resize

void resize(size_t n, const T& val = T())
{
	if (n > capacity())
	{
		reserve(n);
	}

	if (n > size())
	{
		while (_finish < _start + n)
		{
			*_finish = val;
			_finish++;
		}
	}
	else
	{
		_finish = _start + n;
    }
}

5、reserve

void reserve(size_t n)
{
	size_t sz = size();
	if (n > capacity())
	{
		T* tmp = new T[n];
		if (_start)
		{
					//memcpy(tmp, _start, sizeof(T) * sz);
					//如果是vector<vector<int>>类型，那么在拷贝
					//vector中的vector<int>的数据类型时使用memcpy是浅拷贝
					//会被析构两次
			for (size_t i = 0; i < sz; i++)
			{
				tmp[i] = _start[i];
			}
			delete[] _start;
		}
		_start = tmp;
		_finish = _start + sz;
		_end_of_storage = _start + n;
	}
}

五、vector的增删查改

1、push_back

void push_back(const T& x)
{
	if (_finish == _end_of_storage)
	{
		reserve(capacity() == 0 ? 4 : capacity() * 2);
	}
	*_finish = x;
	_finish++;
}

2、pop_back

void pop_back()
{
	assert(_finish > _start);
	_finish--;
}

六、其他构造函数

1、拷贝构造函数

//拷贝构造函数 v2(v1)
vector(const vector<T>& v)
{
	_start = new T[v.size()];
	memcpy(_start, v._start, sizeof(T) * v.size());
			
	_finish = _start + v.size();
	_end_of_storage = _start + v.size();
}

vector(const vector<T>& v)
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	reserve(v.size());
	for (const auto& e : v)
	{
		push_back(e);
	}
}

注：上面的第一种写法其实还有一点bug。举个例子：如果vector里的数据类型是 vector<int>，那么在这memcpy就是一个浅拷贝，虽然vector<vector<int>>有自己的空间，但是里面的数据vector<int>却没有自己的空间，memcpy后，两个对象的vector<int>会指向同一块空间。因此有下面的改进方案

vector(const vector<T>& v)
{
	_start = new T[v.size()];
	for (size_t i = 0; i < v.size(); i++)
	{
		_start[i] = v._start[i];
	}
	_finish = _start + v.size();
	_end_of_storage = _start + v.size();
}

2、构造并初始化

vector(size_t n, const T& val = T())
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	reserve(n);
	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

3、迭代器进行初始化构造

template<class InputIterator>
vector(InputIterator first, InputIterator last)
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	while (first != last)
	{
		push_back(*first);
		first++;
	}
}

有了迭代器的区间构造，我们就可以写出拷贝构造函数的现代写法

void swap(vector<T> v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

vector(const vector<T>& v)
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{
	vector<T> tmp(v.begin(), v.end());
	swap(tmp);
}

七、运算符重载

1、下标访问 [ ]

T& operator[](size_t pos)
{
	assert(pos < size());
	return _start[pos];
}

const T& operator[](size_t pos)const
{
	assert(pos < size());
	return _start[pos];
}

2、赋值构造

//v1 = v2
vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

八、迭代器失效问题（重难点）

1、insert

void insert(iterator pos, const T& x)//返回新插入位置的迭代器 pos
{
	assert(pos >= _start);
	assert(pos <= _finish);
	//满了就扩容:扩容后pos的原位置失效，需要更新pos的位置，
	if (_finish == _end_of_storage)
	{
		reserve(capacity() == 0 ? 4 : capacity() * 2);
	}
	iterator end = _finish - 1;
	while (pos <= end)
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	_finish++;
}

从上面的图中我们可以看出程序出现了错误，这是为什么呢？这是因为我们在第一次扩容时开辟了4个数据的空间，然后插入了4个数据。这时如果我们再插入数据，那么就会发生扩容，也就是会重新开辟空间，而重新开辟空间后pos的位置就没有指向新空间的pos的位置了，pos成为了一个野指针。因此迭代器就失效了。为了解决这个问题，我们就需要重新找到pos的位置，并返回这个位置。

iterator insert(iterator pos, const T& x)//返回新插入位置的迭代器 pos
{
	assert(pos >= _start);
	assert(pos <= _finish);
	//满了就扩容:扩容后pos的原位置失效，需要更新pos的位置，
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;
	}
	iterator end = _finish - 1;
	while (pos <= end)
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	_finish++;
	return pos;
}

2、erase

void erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);
	iterator begin = pos + 1;
	while (begin < _finish)
	{
		*(begin - 1) = *begin;
		begin++;
	}
	_finish--;
}

erase也有失效的情况。

void test()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    
    //删除所有偶数
    auto it = v.begin();
    while(it != v.end())
    {
        if(*it % 2 == 0)
        {
            v.erase(*it);
        }
        it++;
    }

    for(auto e : v)
    {
        cout << e << " ";
    }
}

push_back下面的数及对应结果。

1 2 3 4 5 正常运行

1 2 3 4 崩溃

1 2 4 3 4 5 结果不对

为什么会这样呢？看下图

第二种情况是it和end()已经错过了，且it已经越界了，永远不会相等了。

所以正确的代码如下：

//指向擦除的最后一个元素之后的元素的新位置。pos
iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);
	iterator begin = pos + 1;
	while (begin < _finish)
	{
		*(begin - 1) = *begin;
		begin++;
	}
	_finish--;
	return pos;
}

void test()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    
    //删除所有偶数
    auto it = v.begin();
    while(it != v.end())
    {
        if(*it % 2 == 0)
        {
            it = v.erase(*it);
        }
        else
        {
            it++;
        }
    }

    for(auto e : v)
    {
        cout << e << " ";
    }
}

九、总代码

using namespace std;

namespace zdl
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;
		iterator begin()
		{
			return _start;
		}

		iterator end()
		{
			return _finish;
		}

		const_iterator begin()const
		{
			return _start;
		}

		const_iterator end()const
		{
			return _finish;
		}

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{}

		//拷贝构造函数 v2(v1)
		vector(const vector<T>& v)
		{
			_start = new T[v.size()];
			//memcpy(_start, v._start, sizeof(T) * v.size());
			/*如果是vector<vector<int>>类型，那么在拷贝
		    vector中的vector<int>的数据类型时使用memcpy是浅拷贝
			会被析构两次*/
			for (size_t i = 0; i < v.size(); i++)
			{
				_start[i] = v._start[i];
			}
			_finish = _start + v.size();
			_end_of_storage = _start + v.size();
		}
		/*vector(const vector<T>& v)
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			reserve(v.size());
			for (const auto& e : v)
			{
				push_back(e);
			}
		}*/

		//现代写法
		/*vector(const vector<T>& v)
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			vector<T> tmp(v.begin(), v.end());
			swap(tmp);
		}*/

		//eg : 10个1构造
		vector(size_t n, const T& val = T())
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

		vector(int n, const T& val = T())
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

		//迭代器区间构造
		template<class InputIterator>
		vector(InputIterator first, InputIterator last)
			:_start(nullptr)
			, _finish(nullptr)
			, _end_of_storage(nullptr)
		{
			while (first != last)
			{
				push_back(*first);
				first++;
			}
		}

		void swap(vector<T> v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		//v1 = v2
		vector<T>& operator=(vector<T> v)
		{
			swap(v);
			return *this;
		}

		~vector()
		{
			delete[] _start;
			_start = _finish = _end_of_storage = nullptr;
		}

		size_t size()const
		{
			return _finish - _start;
		}

		size_t capacity()const
		{
			return _end_of_storage - _start;
		}
	
		void reserve(size_t n)
		{
			size_t sz = size();
			if (n > capacity())
			{
				T* tmp = new T[n];
				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz);
					//如果是vector<vector<int>>类型，那么在拷贝
					//vector中的vector<int>的数据类型时使用memcpy是浅拷贝
					//会被析构两次
					for (size_t i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}
				_start = tmp;
				_finish = _start + sz;
				_end_of_storage = _start + n;
			}
		}

		void push_back(const T& x)
		{
			if (_finish == _end_of_storage)
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}
			*_finish = x;
			_finish++;
		}

		void pop_back()
		{
			assert(_finish > _start);
			_finish--;
		}

		iterator insert(iterator pos, const T& x)//返回新插入位置的迭代器 pos
		{
			assert(pos >= _start);
			assert(pos <= _finish);
			//满了就扩容:扩容后pos的原位置失效，需要更新pos的位置，
			if (_finish == _end_of_storage)
			{
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (pos <= end)
			{
				*(end + 1) = *end;
				end--;
			}
			*pos = x;
			_finish++;
			return pos;
		}

		//指向擦除的最后一个元素之后的元素的新位置。pos
		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);
			iterator begin = pos + 1;
			while (begin < _finish)
			{
				*(begin - 1) = *begin;
				begin++;
			}
			_finish--;
			return pos;
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}


		const T& operator[](size_t pos)const
		{
			assert(pos < size());
			return _start[pos];
		}

		void resize(size_t n, const T& val = T())
		{
			if (n > capacity())
			{
				reserve(n);
			}

			if (n > size())
			{
				while (_finish < _start + n)
				{
					*_finish = val;
					_finish++;
				}
			}
			else
			{
				_finish = _start + n;
			}
		}

	private:
		//三者均为指针
		iterator _start;
		iterator _finish;//最后一个数据的下一个位置
		iterator _end_of_storage;//容量的下一个位置
	};
}

dbln

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
5
评论
vector的模拟实现

这时如果我们再插入数据，那么就会发生扩容，也就是会重新开辟空间，而重新开辟空间后pos的位置就没有指向新空间的pos的位置了，pos成为了一个野指针。举个例子：如果vector里的数据类型是 vector<int>，那么在这memcpy就是一个浅拷贝，虽然vector<vector<int>>有自己的空间，但是里面的数据vector<int>却没有自己的空间，memcpy后，两个对象的vector<int>会指向同一块空间。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。
复制链接

扫一扫