vector(c++)

kukubuzai

于 2025-05-17 17:16:40 发布

阅读量849

点赞数 13

文章标签： c++ 开发语言

本文链接：https://blog.csdn.net/kukubuzai/article/details/148027606

版权

前言

正式进入学习STL的第一步就是vector容器， vector是一种用于存储可变大小数组的序列容器，就像数组一样，vector也采用的连续存储空间来存储元素。本质上讲，vector使用动态分配数组来存储它的元素。底层是一个顺序表。本文介绍的是gcc使用的STL源码的vector容器，这也是业界比较认可的一种STL版本。后续的vector模拟实现一切都是向这个版本靠齐。

正文

vector使用

class Print
{
public:
	template<class T>
	static void printVector(vector<T> v)
	{
		for (auto e : v)
		{
			cout << e << " ";
		}
	}
};

这里我先把打印封装成一个类，方便后序测试的打印

vector的定义

vector::vector - C++ Reference	接口说明
vector()（重点）	无参构造
vector（size_type n, const value_type& val = value_type()）	构造并初始化n个val
vector (const vector& x); （重点）	拷贝构造
vector (InputIterator ﬁrst, InputIterator last);	使用迭代器进行初始化构造

//vector的定义
void test01()
{
	//重点
	//初始化列表初始化(c++11特性) c++98不支持
	vector<int> v1 = { 1,2,3,4 };
	vector<int> v2(v1);
	Print::printVector(v1);
	cout << endl;
	Print::printVector(v2);
	cout << endl;
	vector<int> v3(10,-1);
	vector<int> v4(v1.begin(),v1.end());
	Print::printVector(v3);
	cout << endl;
	Print::printVector(v4);
}

这里着重掌握无参构造和拷贝构造，其他的了解即可

vector iterator 的使用

iterator的使用	接口说明
begin + end（重点）	获取第一个数据位置的iterator/const_iterator，获取最后一个数据的下一个位置的iterator/const_iterator
rbegin + rend	获取最后一个数据位置的reverse_iterator，获取第一个数据前一个位置的 reverse_iterator

//vector iterator 的使用
//正向迭代器和反向迭代器
void test02()
{
	vector<int> v1 = { 1,2,3,4 };
	vector<int> v2(v1);
	vector<int>::iterator it1 = v1.begin();
	while (it1 != v1.end())
	{
		cout << *it1 << " ";
		it1++;
	}
	cout << endl;
	auto it2 = v2.rbegin();
	while (it2 != v2.rend())
	{
		cout << *it2 << " ";
		it2++;

	}

}

这里的迭代器没啥好说的，会使用就行，不过要注意迭代器失效，下面会着重讲。

vector 容量

容量空间	接口说明
size	获取数据个数
capacity	获取容量大小
empty	判断是否为空
resize（重点）	改变vector的size
reserve （重点）	改变vector的capacity

//vector 容量
void test03()
{
	vector<int> v1 = { 1,2,3,4 };
	vector<int> v2(v1);
	//重点
	Print::printVector(v2);
	cout << endl;
	//大于size()
	v2.resize(10, -1);
	Print::printVector(v2);
	cout << endl;
	//小于size()
	v2.resize(3, -1);
	Print::printVector(v2);
	cout << endl;
	//size capacity empty
	size_t size = v1.size();
	size_t capacity = v1.capacity();
	cout << "v1: " << size << " " << capacity << " " << (v1.empty() ? "true" : "false") << endl;
	
}

和string的容量大差不差，会使用即可

vector 增删查改

vector 增删查改	接口说明
push_back（重点）	尾插
pop_back （重点）	尾删
ﬁnd	查找。（注意这个是算法模块实现，不是vector的成员接口）
insert	在position之前插入val
erase	删除position位置的数据
swap	交换两个vector的数据空间
operator[] （重点）	像数组一样访问

//vector 增删查改
void test04()
{
	vector<int> v1;
	//重点
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	vector<int> v2(v1);
	v1.pop_back();
	cout << "v1:test: ";
	for (size_t i = 0; i < v1.size(); i++)
	{
		cout << v1[i] << " ";
	}
	cout << endl;
	cout << "v2:test: ";
	for (size_t i = 0; i < v2.size(); i++)
	{
		cout << v2[i] << " ";
	}
	cout << endl;
	//find insert erase swap
	//...就不测试了 大家自己测试下吧 都是很简单的
}

这里的增删查改和string的差不多，不过要注意vector并没有find接口，这个接口是算法的接口，就是再一段区间找值并返回迭代器而已，很简单。

vector 迭代器失效问题。（重点）

//vector 迭代器失效问题。（重点）
void test05()
{
	vector<int> v1 = { 1,2,3,4,5,6 };
	vector<int> v2(v1);
	auto it1 = v1.begin();
	while (it1 != v1.end())
	{
		if (*it1 % 2 == 0)
		{
			v1.erase(it1);
		}
		else
		{
			it1++;
		}
	}
	Print::printVector(v1);
	auto it2 = v2.begin();
	while (it2 != v2.end())
	{
		if (*it2 % 2 == 0)
		{
			it2 = v2.erase(it2);
		}
		else
		{
			it2++;
		}
	}
	Print::printVector(v2);
}

这里才是重点，要了解迭代器失效问题，就要先了解迭代器的原理底层，vector的迭代器底层本质还是指针实现的。所以指针就会涉及拷贝时的一个深浅拷贝，指针指向的地址的问题。由于是深拷贝，所以如果涉及到扩容，我们就会新开辟一块新空间，把原来的数据拷贝到这里。但是，迭代器还是指向原来空间的位置，原来的空间已经被释放掉，所以这里迭代器失效本质上就是一个野指针。那怎么解决这个问题呢？总不能不深拷贝吧？改变下参数吗？参数改变也没啥用呀。我erase是删除迭代器位置的数据，对你还要不要使用这个迭代器我没有义务保证你的安全呀？所以，我们对返回值做文章，返回要删除数据的下一个迭代器。这也是为啥insert会有一个返回值，返回插入位置的迭代器。

这里还涉及一个平台检查问题，下面这段代码在gcc下是可以编译通过的，但是在vs下直接报错

	vector<int> v1 = { 1,2,3,4,5,6 };
	auto it1 = v1.begin();
	while (it1 != v1.end())
	{
		if (*it1 % 2 == 0)
		{
			v1.erase(it1);
		}
		else
		{
			it1++;
		}
	}
	Print::printVector(v1);

因此，这里有一个结论，insert和erase之后我们一致认为你的迭代器是失效，使用它结果是未定义的。

vector的模拟实现

这里才是学习vector的重头戏，只有自己模拟实现一个vector，你才能正真理解这个容器的设计。

成员变量

private:
	T* _start = nullptr;
	T* _finish =nullptr;
	T* _endofstorage = nullptr;

为啥这里不是，size,capacity,_arr呢？咋是什么_finish？这是啥？其实这和STL的设计理念有关，这里从vector开始就几乎基本全面介入迭代器了。vector的迭代器底层就是T*。所以，他的变量要设计成这样也是为了向迭代器靠拢，_start就是数组的起始位置,_finish是最后一个数据的下一个位置,_endifstorage就是容器的底部的下一个位置。这里我给了初始值(c++11打入的补丁)，所以后面构造函数我没有在初始化值了。

这里先实现下swap函数，方便后续函数的编写。

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

默认成员函数

这里我使用的是直接new delete管理动态内存分配，但是原版STL使用的是空间配置器，其实底层还是包装new delete而已，但不过人家的这个空间配置器效率更高。对于我们初学者，先使用new delete就可以了，如果现在就要你学习空间配置器，让你掌握并使用。那可谓真的是从入门到放弃。一般来说空间配置器是c++很后面才会讲的。

构造析构

vector()
{

}
vector(size_t n,const T& val = T())
{
	resize(n, val);
}
vector(int n, const T& val = T())
{
	resize(n, val);
}
//再套一个类模板
//相比上一个构造函数 匹配程度更高 和类型有关
template<class InputIterator>
vector(InputIterator first, InputIterator last)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}

}
~vector()
	{
		if (_start)
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}
	}

这里构造析构没啥坑，就是正常实现就行。

拷贝构造

	vector(const vector<T>& v)
	{
		_start = new T[v.capacity()];
		//memcpy(_start, v._start, sizeof(T) * v.size());
		//解决对象的深拷贝
		for (size_t i = 0; i < size(); i++)
		{
			_start[i] = v._start[i];
		}
		_finish = _start + v.size();
		_endofstorage = _start + v.capacity();
	}

这里是一个难点，主要是深拷贝的问题，对于内置类型的靠别没有问题。但是如果是自定义类型，使用memcpy就是一个浅拷贝。那如何解决呢？使用for循环，使用它们内部的赋值重载一个个赋值。

赋值重载

	vector<T>& operator=(vector<T> v)
	{
		swap(v);
		return *this;
	}

迭代器

这里我并没有实现反向迭代器

typedef T* iterator;
typedef const T* const_iterator;
iterator begin()
{
	return _start;
}
iterator end()
{
	return _finish;
}
const_iterator begin() const
{
	return _start;
}
const_iterator end() const
{
	return _finish;
}

容量操作

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz);
					for (size_t i = 0; i < size(); i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}
				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}
		//匿名对象当省略值 如果是内置类型 c++会特殊处理 升级成对象 调用无参构造
		void resize(size_t n, const T& val = T())
		{
			if (n < capacity())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish != _start + n)
				{
					*_finish = val;
					_finish++;
				}
			}
		}
		size_t size() const
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _endofstorage - _start;
		}
		bool empty()
		{
			return size() == 0;
		}

这里的扩容，和上面拷贝构造函数内部迭代器失效是一个原理，所以我们也要换一下拷贝，不能使用memcpy。

增删查改和访问引用操作

访问引用

	T& operator[](size_t pos)
	{
		assert(pos < size());
		return _start[pos];
	}
	const T& operator[](size_t pos) const
	{
		assert(pos < size());
		return _start[pos];
	}

增删查改

		iterator erase(iterator pos)
		{
			assert(pos >= _start && pos < _finish);
			iterator end = pos;
			while (end < _finish)
			{
				*end = *(end + 1);
				end++;
			}
			_finish--;
			return pos;
		}
		iterator erase(iterator first, iterator last)
		{
			assert(first >= _start && first <= _finish);
			assert(last >= _start && last <= _finish);
			assert(first <= _finish);
			iterator it1 = first, it2 = last;
			size_t len = last - first;
			//1 2 3 4 5
			while (it1 <= last)
			{
				*it1 = *(it2);
				it1++;
				it2++;
			}
			_finish -= len;
			return last;
		}
		void push_back(const T& x)
		{
			if (_finish == _endofstorage)
			{
				size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();
				reserve(newcapacity);
			}
			*_finish = x;
			_finish++;
		}
		void pop_back()
		{
			erase(--end());
		}
		iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start && pos <= _finish); //等于就是尾插和头插
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;
				size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();
				reserve(newcapacity);
				//解决内部迭代器失效
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				end--;
			}
			*pos = x;
			_finish++;
			return pos;
		}

vector实现二维数组

实际上就是一个函数套一个函数而已，那这样岂不是效率很低，放心它会直接升级内联的。和c++讲效率低，你简直是在侮辱它？

void test06()
{
	vector<vector<int>> arr = { {1,},{1,2},{1,2,3} };
	//vector<vector<int>>
	for (auto e : arr)
	{
		//e : vector<int>
		for (auto i : e)
		{
			//i int
			cout << i << " ";
		}
		cout << endl;
	}
}

源码

#pragma once
#include <stdio.h>
#include <assert.h>
//vector insert和erase之后我们认为迭代器是失效的
//访问结果是未定义的
namespace che 
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;
		iterator begin()
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator begin() const
		{
			return _start;
		}
		const_iterator end() const
		{
			return _finish;
		}
		vector()
		{

		}
		vector(size_t n,const T& val = T())
		{
			resize(n, val);
		}
		vector(int n, const T& val = T())
		{
			resize(n, val);
		}
		//再套一个类模板
		//相比上一个构造函数 匹配程度更高 和类型有关
		template<class InputIterator>
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}

		}
		vector(const vector<T>& v)
		{
			_start = new T[v.capacity()];
			//memcpy(_start, v._start, sizeof(T) * v.size());
			//解决对象的深拷贝
			for (size_t i = 0; i < size(); i++)
			{
				_start[i] = v._start[i];
			}
			_finish = _start + v.size();
			_endofstorage = _start + v.capacity();
		}
		//其他写法
		~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endofstorage = nullptr;
			}
		}
		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}
		vector<T>& operator=(vector<T> v)
		{
			swap(v);
			return *this;
		}
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz);
					for (size_t i = 0; i < size(); i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}
				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}
		iterator erase(iterator pos)
		{
			assert(pos >= _start && pos < _finish);
			iterator end = pos;
			while (end < _finish)
			{
				*end = *(end + 1);
				end++;
			}
			_finish--;
			return pos;
		}
		iterator erase(iterator first,iterator last)
		{
			assert(first >= _start && first <= _finish);
			assert(last >= _start && last <= _finish);
			assert(first <= _finish);
			iterator it1 = first, it2 = last;
			size_t len = last - first;
			//1 2 3 4 5
			while (it1 <= last)
			{
				*it1 = *(it2);
				it1++;
				it2++;
			}
			_finish-=len;
			return last;
		}
		void push_back(const T& x)
		{
 			if (_finish == _endofstorage)
			{
				size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();
				reserve(newcapacity);
			}
			*_finish = x;
			_finish++;
		}
		//匿名对象当省略值 如果是内置类型 c++会特殊处理 升级成对象 调用无参构造
		void resize(size_t n, const T& val = T())
		{
			if (n < capacity())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish != _start + n)
				{
					*_finish = val;
					_finish++;
				}
			}
		}
		void pop_back()
		{
			erase(--end());
		}
		iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start && pos <= _finish); //等于就是尾插和头插
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;
				size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity();
				reserve(newcapacity);
				//解决内部迭代器失效
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				end--;
			}
			*pos = x;
			_finish++;
			return pos;
		}
		size_t size() const
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _endofstorage - _start;
		}
		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}
		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}
	private:
		T* _start = nullptr;
		T* _finish =nullptr;
		T* _endofstorage = nullptr;
	};
}