C++小白的逆袭之路——初阶（第九章：vector）-CSDN博客

本文链接：https://blog.csdn.net/weixin_73870552/article/details/134463508

1.vector的介绍和使用

1.1vector的介绍

在这里插入图片描述
vector是典型的模版实现，类的声明里包含一个参数是模版参数，第二个参数中出现了一个Alloc，这个我们以后会讲，现在先不说。大家只需要知道，Alloc是STL中六大组件中的其中一个，也就是空间配置器，本质就是一个内存池。

vector是一个可以动态增长的数组实现的顺序容器。就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。因此，vector占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。

与其它动态序列容器相比（deque, list and forward_list）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。

使用STL的三个境界：能用，明理，能扩展，那么下面学习vector，我们也是按照这个方法去学习。

1.2vector的使用

1.2.1构造、拷贝构造函数

在这里插入图片描述

(constructor)构造函数声明	接口说明
vector()（重点）	无参构造
vector（size_type n, const value_type& val = value_type()）	构造并初始化n个val
vector (const vector& x); （重点）	拷贝构造
vector (InputIterator first, InputIterator last)	使用迭代器进行初始化构造

void test1_vector()
{
	vector<int> v1;
	vector<int> v2(10, 0);							// 初始化给10个0
	vector<int> v3(v2.begin(), v2.end());			// 使用v2的迭代器初始化v3

	string str("hello world");
	vector<char> v4(str.begin(), str.end());		// 不只可以用vector的迭代器初始化
	vector<char> v5(v4);							// 拷贝构造

	for (size_t i = 0; i < v3.size(); i++)
	{
		cout << v3[i] << " ";						// 使用了重载[]
	}
	cout << endl;

	vector<char>::iterator it = v4.begin();			// 使用迭代器遍历
	while (it != v4.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

	for (auto ch : v5)
	{
		cout << ch << " ";
	}
	cout << endl;
}

输出：

0 0 0 0 0 0 0 0 0 0
h e l l o   w o r l d
h e l l o   w o r l d

1.2.2vector空间增长问题

容量空间	接口说明
size	获取数据个数
capacity	获取容量大小
empty	判断是否为空
resize（重点）	改变vector的size
reserve （重点）	改变vector的capacity

测试环境为VS2022：

// 测试vector的默认扩容机制
void TestVectorExpand()
{
	size_t sz;
	vector<int> v;
	sz = v.capacity();
	cout << "making v grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		v.push_back(i);
		if (sz != v.capacity())
		{
			sz = v.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}

输出：

making v grow:
capacity changed: 1
capacity changed: 2
capacity changed: 3
capacity changed: 4
capacity changed: 6
capacity changed: 9
capacity changed: 13
capacity changed: 19
capacity changed: 28
capacity changed: 42
capacity changed: 63
capacity changed: 94
capacity changed: 141

发现VS下的扩容机制大概为扩1.5倍。如果把同样的代码放到g++的环境下编译，结果就是2倍扩容。

注意几个容易出错的点：

1）想要提前开空间应该严格使用reserve，而不能使用resize。来看这样一段代码：

void TestVectorExpand()
{
	size_t sz;
	vector<int> v;
	v.resize(100);				// resize(100)
	sz = v.capacity();
	cout << "making v grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		v.push_back(i);
		if (sz != v.capacity())
		{
			sz = v.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
}

此时，push_back插入数据是从100的位置开始向后插入的，这就很坑了。所以当我们执行这段代码时发现，v仍然会扩容，输出：（resize还会将数据初始化成0）

making v grow:
capacity changed: 150
capacity changed: 225

2）不正确的初始化：

void test2_vector()
{
	vector<int> v;
	v.reserve(100);			// size = 0;

	for (size_t i = 0; i < v.size(); i++)
		v[i] = i;
}

我们的预期是用1到100初始化v，但是这段代码达不到预期效果，也不会崩溃。因为虽然v的capacity改变了，但是size仍然是0，所以循环压根就不会进去。

还有一个缩容接口：

在这里插入图片描述

他的作用就是在capacity比size大时，将capacity缩小为size，实现缩容。但是这种缩容一般都是异地缩容，是一种以时间换空间的做法，一般不会用。

1.2.3vector元素的访问

在这里插入图片描述

这些接口都比较简单，这里就简单的说一说。

operator[]在出现一些越界访问的错误时，会直接报错，终止程序。at在遇到越界访问问题时，会抛异常，而不会直接终止掉程序。front就是访问头部元素，back就是访问尾部元素。

1.2.4vector增删查改

在这里插入图片描述

vector增删查改	接口说明
push_back（重点）	尾插
pop_back （重点）	尾删
find	查找。（注意这个是算法模块实现，不是vector的成员接口）
insert	在position之前插入val
erase	删除position位置的数据
swap	交换两个vector的数据空间
operator[]	（重点）像数组一样访问

find在这里是算法库中的函数，vector类内没有提供。find是用模版的方式实现的，使用于各种SLT容器，除了string。有两个原因，一是string出现的比较早；二是string中find的需求不一样，需要查找一个字符，或者查找一串字符。

在这里插入图片描述

template<class InputIterator, class T>
	InputIterator find (InputIterator first, InputIterator last, const T& val)
{
  while (first!=last) {
    if (*first==val) return first;
    ++first;
  }
  return last;
}

前两个参数是迭代器类型，第三个参数是需要查找的数据，返回值也是迭代器类型数据。作用是在一个迭代器区间内，查找数据val。如果找不到就返回last，找到了就返回first。

insert的用法：

在这里插入图片描述

iterator insert(iterator position, const value_type& val);的作用是在pos位置前插入数据val（pos是迭代器类型数据）。void insert(iterator position, size_type n, cosnt value_type& val);的作用是在pos位置前插入n个数据。最后一个函数作用是在pos位置前，插入一段迭代器区间的数据。

vector插入的代码演示：

void test3_vector()
{
	vector<int> v;

	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	for (auto x : v)
	{
		cout << x << " ";
	}
	cout << endl;

	v.insert(v.begin(), 0);

	for (auto x : v)
	{
		cout << x << " ";
	}
	cout << endl;

	auto it = find(v.begin(), v.end(), 3);
	if (it != v.end())		// 判断是否找到
	{
		v.insert(it, 30);
	}

	for (auto x : v)
	{
		cout << x << " ";
	}
	cout << endl;
}

输出;

1 2 3 4
0 1 2 3 4
0 1 2 30 3 4

erase的用法：

在这里插入图片描述

iterator erase(iterator position);作用是删除pos位置的数据，pos是迭代器类型的数据；iterator erase(iterator first, iterator last);作用是删除一段迭代器区间内的数据。

void test4_vector()
{
	vector<int> v;

	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	for (auto x : v)
		cout << x << " ";
	cout << endl;

	auto it = find(v.begin(), v.end(), 3);
	if (it != v.begin())
		v.erase(it);

	for (auto x : v)
		cout << x << " ";
	cout << endl;
}

输出：

1 2 3 4
1 2 4

clear的作用：

clear只是清空数据，它会将size改成0，而不会改变capacity。如果我们也想改变capacity也将其置零，需要配合shrink_to_fit使用。

void test5_vector()
{
	vector<int> v;

	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	v.clear();
	v.shrink_to_fit();

	cout << v.capacity() << endl;
	cout << v.size() << endl;
}

输出：

0
0

emplace和emplace_back：

这两个函数我们现在看不懂，先不用了解。只需要了解，emplace的作用跟insert一样，emplace_back的作用跟push_back一样。

1.2.5vector迭代器失效问题（重点）

建议先看完insert和erase的模拟实现再跳过来看迭代器失效问题。

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃（即如果继续使用已经失效的迭代器，程序可能会崩溃）。

对于vector可能导致迭代器失效的操作有：

会引起其底层空间改变的操作，都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。
指定位置元素的删除操作–erase。

与vector类似，string在插入，扩容操作，erase之后，迭代器也会失效：

void TestString()
{
	string s("hello");
	auto it = s.begin();
	
	// 放开之后代码会崩溃，因为resize到20会string会进行扩容
	// 扩容之后，it指向之前旧空间已经被释放了，该迭代器就失效了
	// 后序打印时，再访问it指向的空间程序就会崩溃
	//s.resize(20, '!');
	while (it != s.end())
	{
		cout << *it;
		++it;
	}
	cout << endl;
	
	it = s.begin();
	while (it != s.end())
	{
		it = s.erase(it);
		// 按照下面方式写，运行时程序会崩溃，因为erase(it)之后
		// it位置的迭代器就失效了
		// s.erase(it);
		++it;
	}
}

解决办法：在使用之前，对迭代器重新赋值即可。

1.3一些练习题目

leetcode只出现一次的数字：https://leetcode.cn/problems/single-number/

class Solution {
public:
    int singleNumber(vector<int>& nums) 
    {
        int val = 0;
        for(auto e : nums)
        {
            val ^= e;
        }
        return val;
    }
};

leetcode杨辉三角：https://leetcode.cn/problems/pascals-triangle/description/

class Solution {
public:
    vector<vector<int>> generate(int numRows) 
    {
        vector<vector<int>> ret;
        ret.resize(numRows);

        for(int i = 0; i < numRows; i++)
        {
            ret[i].resize(i + 1, 0);                    // 开空间，赋初始值0
            ret[i][0] = ret[i][ret[i].size() - 1] = 1;  // 头尾的值是1
        }

        for(int i = 0; i < numRows; i++)
        {
            for(int j = 0; j < ret[i].size(); j++)
            {
                if(ret[i][j] == 0)
                    ret[i][j] = ret[i - 1][j] + ret[i - 1][j - 1];
            }
        } 

        return ret;
    }
};

这里要理解一个东西：vectoe<vector<int>>
在这里插入图片描述

vector<vector<int>>中_a指向的内容是一个一个的vector<int>，而vector<int>的_a指向的才是int类型的数据。相当于一个二维数组，访问的方式和C语言中二维数组的访问相同，都是用两个[]，但是原理上有很大差别。

2.vector的模拟实现

2.1库中vector的核心

template <class T, class Alloc = alloc>
class vector {
public:
	typedef T value_type;
	typedef value_type* iterator;
	typedef const value_type* const_iterator;
	iterator start;
	iterator finish;
	iterator end_of_storage;
}

库中vector的迭代器是用指针实现的，类型是value_type*，实际上就是T*。

其中，控制有效区间和防止越界的参数是start、finish和end_of_storage，三者的类型都是迭代器类型，也就是指针。start指向空间开始的位置，finish指向有效区间的后一个位置，end_of_storage指向开辟空间的末尾。（左闭右开）

在这里插入图片描述

2.2迭代器，构造，析构

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		// 迭代器
		iterator begin() { return _start; }
		iterator end() { return _finish; }
		const_iterator begin() const { return _start; }
		const_iterator end() const { return _finish; }

		// capacity和size
		size_t capacity() { return _endofstorage - _start; }
		size_t size() { return _finish - _start; }

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{}

		~vector()
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

这些函数都没什么要说的，都很简单，大家看一看，熟练掌握。只需要注意一点：对于左闭右开的区间，有效数据个数size就等于_finish - _start；容量capacity就等于_endofstorage - _start。

2.3模拟实现push_back

namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// ...

		void push_back(const T& x)
		{
			if (_finish == _endofstorage)
			{
				size_t sz = size();		// size提前记录
				size_t cp = capacity() == 0 ? 4 : capacity() * 2;
				T* tmp = new T[cp];
				if (_start)				// 判断顺序表是否为空，不为空要进行拷贝
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + cp;
			}

			*_finish = x;
			++_finish;
		}
		
		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意：

size需要提前记录，更新_finish时不能写成_finish = _start + size()。因为size等于_endofstorage - _start，而此时_start已经更新了，_endofstorage - start就是一个不能确定的结果，所以我们要将size提前记录。
扩容记录cp时，要判断一下capacity()是否等于0，因为等于0的情况我们要单独处理。
需要判断_start是否为空，不为空要进行数据的拷贝。

2.4模拟实现operator[]

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

这个也没什么要强调的，大家熟练掌握。

2.5reserve和resize

namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// ...
		
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				T* tmp = new T[n];
				size_t sz = size();

				if (_start)
				{
					memcpy(tmp, _start, sizeof(T) * sz);
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		// void resize(size_t, T val = T())
		void resize(size_t n, const T& val = T())
		{
			if (n <= size())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
		}

		void push_back(const T& x)
		{
			if (_finish == _endofstorage)
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}

			*_finish = x;
			++_finish;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意：

1.reserve实现的逻辑和我们第一次写push_back扩容的逻辑是一样的，只不过要加上一点，判断一下n是否大于capacity，不大于capacity就不做处理。

2.有了reserve，就可以改造push_back，在push_back中复用reserve即可。

3.resize的第二个参数要写成 T val = T()或const T& val = T()，这两种写法本质上是一样的。基本的思想就是写一个缺省参数，=右边是一个匿名参数。T val = T()这句代码的逻辑是先调构造函数生成一个匿名对象，再调拷贝构造函数深拷贝给val，不过编译器一般会优化为直接调用构造函数构造val；const T& val = T()的逻辑是const延长匿名对象的生命周期，切记不能不带const。

为什么使用匿名对象？设想，数据类型T可能是int，可能是double，甚至可能是vector<int>，等等，我们如何将这些情况都考虑进去呢？最好的办法就是匿名参数，这样执行T()这段代码时，就可以调用T类型对应的默认构造函数。

有同学可能会问，int，double这种内置类型也有默认构造函数吗？答案是有的，在模版出现以后，C++语法进行了升级，各种内置类型都有了自己的默认构造函数。这也体现了一切皆对象的思想，只不过C++不是纯粹的面向对象，它也兼容C语言，也体现面向过程。我们来验证一下：

// 一切皆对象
void test()
{
	int i = 1;
	int j(1);
	int k = int(1);
	double b = double();

	cout << i << "\n" << j << "\n" << k << "\n" << b << endl;
}

输出：

4.resize中，如果n <= size()，直接缩减有效数据空间即可，也就是将_finish改动一下，本质充当的是删除的作用。若n > size()，则要将默认参数val填充进去，在这之前，最好先reserve一下，保证开辟的空间够用。

上面所写的reserve在遇到string时会出问题，后面再说。

2.6模拟实现insert

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void insert(iterator pos, const T& x)
		{
			assert(pos >= _start);
			assert(pos <= _finish);

			// 涉及迭代器失效 -- 内部失效
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;		// 记录偏移量
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;				// 更新pos
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;
		}

		// ...
		
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意：

1.如果我们将纪录偏移量和更新pos的两段代码注释掉，pos会变成野指针。这是因为扩容后，pos指向原来的空间，被释放掉了，而end指向的是新空间，二者根本就没法进行比较。

2.insert涉及迭代器失效。看一段代码：

int main()
{
 	LHY::vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	
	LHY::vector<int>::iterator it = v.begin() + 2;
	v.insert(it, 30);
	// 之后这个it还能不能用？

	return 0;
}

如果我们设置了一个迭代器it，在insert后，it还能不能使用？答案是不能。因为我们不知道当前vector在插入数据后是否发生了扩容，如果发生了扩容，那么insert后，it指向的就是被释放的原空间，it就失效了。

用insert来实现push_back：

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void push_back(const T& x)
		{
			insert(end(), x);
		}

		// ...
		
	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

2.7模拟实现erase

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意： erase也涉及迭代器失效。

研究下面的代码：

void test3()
{
	LHY::vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	// v中的数据是1 2 3 4 5

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	// 删除偶数
	auto it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
		{
			v.erase(it);
		}
		++it;
	}

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

输出：

1 2 3 4 5
1 3 5

发现达到了预期效果，那如果将数组v初始化成1 2 3 4 5 6呢？或者2 2 3 4 5呢？

发现，数组为1 2 3 4 5 6时直接报错。为2 2 3 4 5时输出的结果为2 3 5，显然不满足预期，这是为何？

1）我们先来研究下2 2 3 4 5的情况。

在这里插入图片描述

最开始，it指向首元素2，_finish指向5的后一个位置。（此处所说的it是测试函数中的it，不是erase函数中的it）。发现第一个元素为2是偶数后，删除该位置的元素，将第二个元素的值赋给了第一个元素，后续元素整体向前移一位，随后++it，_finish--。

在这里插入图片描述

随后判断it位置的值是不是偶数，再进行相关操作。分析到这里相信大家已经发现问题了，有一个偶数被漏掉了，所以我们整个逻辑其实是有问题的。

2）再来研究下1 2 3 4 5 6的情况。

这种情况其实前面都没有问题，直到it指向最后一个元素6，就会出问题。

在这里插入图片描述

此时刚刚成功删除元素4，it指向了最后一个元素6，_finish指向最后一个元素的后一个位置。判断发现6是偶数，但是此时erase函数中的循环并不会进去，不发生数据挪动，会直接将_finish--，让6数据无效，随后++it。

在这里插入图片描述

可以发现_finish和it完美错过，测试函数中的循环条件it != v.end()永远满足，再次进入erase函数，触发assert，发生越界。

综上，可以说1 2 3 4 5满足预期的情况纯属是个意外，所以我们认为，erase函数会引发迭代器失效，使用时应格外注意。

不同的环境下结果不同：

如果上述代码在VS环境下运行，会全部报错。

// 1 2 3 4 5  		报错
// 2 2 3 4 5		报错
// 1 2 3 4 5 6		报错

我们虽然是在VS下写的代码，但是我们的设计风格是和g++一样的，没有用std::vector<int> v;，如果用了将全部报错，大家可以自行尝试。VS有一个特点，它会强制检查，如果执行了一次erase，就不让再++it了（测试函数中的it）。

如果上述代码在Linux下运行，和我们分析的结果是一样的。

// 1 2 3 4 5		达到预期
// 2 2 3 4 5		结果错误
// 1 2 3 4 5 6		报错

那么该如何解决erase和insert的迭代器失效问题呢？让我们再来仔细看一看这两个函数的介绍：

在这里插入图片描述

可以发现，这两个函数其实是有返回值的，erase返回的是删除数据的下一个位置，insert返回的是新插入的第一个数据的位置。

正确实现insert和erase：

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start);
			assert(pos <= _finish);

			// 涉及迭代器失效 -- 内部失效
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;		// 记录偏移量
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;				// 更新pos
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;
			return pos;
		}

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
			return pos;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

正确使用erase和insert：

void test3()
{
	LHY::vector<int> v;
	v.push_back(2);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	v.push_back(6);

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;

	// 删除偶数
	auto it = v.begin();
	while (it != v.end())
	{
		if (*it % 2 == 0)
		{
			it = v.erase(it);
		}
		else
		{
			++it;
		}
	}

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

insert的返回值一般用不到。

2.8vector遇到string时会出现的问题

一定要用之前模拟实现的push_back。

测试一段代码：

void test4()
{
	LHY::vector<string> v;

	v.push_back("111111111111111111");
	v.push_back("111111111111111111");
	v.push_back("111111111111111111");
	v.push_back("111111111111111111");
	// v.push_back("111111111111111111");	一会再放开

	for (auto e : v)
		cout << e << endl;
}

输出：

111111111111111111
111111111111111111
111111111111111111
111111111111111111

放开上面代码的注释，发现程序出错，输出：

葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
葺葺葺葺葺葺葺葺葺
111111111111111111

前四行出现乱码，这是为什么？我们大胆猜测一下，问题可能出在reserve扩容上。通过调试发现，在代码执行到reserve中的delete后，乱码出现了。

在这里插入图片描述

其实，问题就出在memcpy这个函数上，是深层次的浅拷贝问题，借助一个图来说明：

在这里插入图片描述

_start指向的空间中，存放着4个string类型的数据，其中4个string类数据的_str分别指向4块存放着字符串的空间。由于最开始v数组的容量是4，所以在执行第5个push_back时，需要先进行扩容。先是开辟了一块新的更大的空间给tmp，然后再用memcpy将原有空间的数据拷贝给tmp，此时问题出现了。在拷贝的过程中，memcpy以逐字节的方式将原空间中的_str，_size，_capacity都给了tmp，导致tmp前4个string类数据的_str也指向原空间所指向的内容。在delete时，会将新旧空间一并释放，出现乱码。

如何解决问题？

只需要改造一下扩容，赋值运算符即可：

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		
		// ...

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				T* tmp = new T[n];
				size_t sz = size();

				if (_start)
				{
					// memcpy(tmp, _start, sizeof(T) * sz);		不能用
					for (int i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

tmp是内置类型，=就是一个普通的赋值。tmp是自定义类型，=就是一个赋值重载，无论如何都是深拷贝。

2.9模拟实现拷贝构造和赋值重载

namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// capacity和size
		size_t capacity() const { return _endofstorage - _start; }
		size_t size() const { return _finish - _start; }
		
		// ...

		vector(const vector<T>& v)
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(v.capacity());
			for (auto& e : v)
				push_back(e);
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		vector<T>& operator=(vector<T> tmp) // vector& operator=(vector tmp)
		{
			swap(tmp);
			return *this;
		}

		// ...

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

注意：

capacity函数必须为const成员函数，否则拷贝构造函数无法使用。从这一点可以看出，capacity和size函数定义为const成员函数比较好，以便一些const类型使用。
vector<T>中的<T>可以去掉，但是不建议大家去掉。类名不是类型，在类里面可以直接写类名。

2.10其他几种构造函数（非默认构造）

namespace LHY
{
	template<class T>
	class vector
	{
	public:

		vector() {}			// 默认构造函数，不能不写

		// 使用迭代器区间初始化
		template <class InputIterator>
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

		// 使用n个val初始化
		vector(size_t n, const T& val = T())
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}
		
		// ...

	private:
		iterator _start = nullptr;
		iterator _finish = nullptr;
		iterator _endofstorage = nullptr;
	};
}

注意：

类模版里面也可以嵌套模版。
为了简化代码，避免每写一个构造函数都要初始化三个成员变量，索性将成员变量在声明处给值。但是这样写带来一个问题，有同学可能认为既然在声明处初始化了，那自己就可以不写无参的构造函数了。这样的想法是错误的，因为只要我们写了任何一种形式的构造函数，编译器将不再生成默认构造函数，也就没有无参的构造函数。

测试一段代码：

void test5()
{
	// LHY::vector<int> v2(10, 0); 			放开后报错	
	LHY::vector<string> v1(10, "xxx");

	for (size_t i = 0; i < v1.size(); i++)
	{
		cout << v1[i] << " ";
	}
	cout << endl;
}

放开注释的那段代码后程序报错，提示非法的间接寻址，这是为什么？

这是因为编译器在执行LHY::vector<int> v2(10, 0); 这句代码时，匹配到了用迭代器区间初始化的构造函数。我们来具体分析一下，LHY::vector<int> v2(10, 0); 如果要进行实例化，走vector(InputIterator first, InputIterator last)，那它就会实例化出一个vector(int firse, int last)函数；如果走vector(size_t n, const T& val = T())，就会实例化出一个vector(size_t n, const int& val = int())函数，还要进行整形提升。显然，这句代码和用迭代器区间初始化的构造函数更匹配。

那为什么LHY::vector<string> v1(10, "xxx");可以编过呢？因为10和xxx这两个实参的类型就不一样，只能走vector(size_t n, const T& val = T())。

为了解决这个问题，我们只能写一个比vector(InputIterator first, InputIterator last)更适合LHY::vector<int> v2(10, 0); 的构造函数，这个构造函数如下：

namespace LHY
{
	template<class T>
	class vector
	{
	public:

		// ...

		vector(int n, const T& val = T())
		{
			reserve(n);
			for (int i = 0; i < n; i++)
			{
				push_back(val);
			}
		}
		
		// ...

	private:
		iterator _start = nullptr;
		iterator _finish = nullptr;
		iterator _endofstorage = nullptr;
	};
}

这个构造函数的两个形参对于LHY::vector<int> v2(10, 0); 来说，T是int，那么vector(int n, const T& val = T())的两个形参就直接是int类型，跟LHY::vector<int> v2(10, 0); 完美匹配。

3.vector模拟实现完整代码

#pragma once

#include<assert.h>
#include<iostream>

using namespace std;

namespace LHY
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		// 迭代器
		iterator begin() { return _start; }
		iterator end() { return _finish; }
		const_iterator begin() const { return _start; }
		const_iterator end() const { return _finish; }

		// capacity和size
		size_t capacity() const { return _endofstorage - _start; }
		size_t size() const { return _finish - _start; }

		vector()
			:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{}

		template <class InputIterator>
		vector(InputIterator first, InputIterator last)
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

		vector(size_t n, const T& val = T())
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (size_t i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

		vector(int n, const T& val = T())
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(n);
			for (int i = 0; i < n; i++)
			{
				push_back(val);
			}
		}

		vector(const vector<T>& v)
			: _start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)
		{
			reserve(v.capacity());
			for (auto& e : v)
				push_back(e);
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		vector<T>& operator=(vector<T> tmp)
		{
			swap(tmp);
			return *this;
		}

		~vector()
		{
			delete[] _start;
			_start = _finish = _endofstorage = nullptr;
		}

		void reserve(size_t n)
		{
			if (n > capacity())
			{
				T* tmp = new T[n];
				size_t sz = size();

				if (_start)
				{
					// memcpy(tmp, _start, sizeof(T) * sz);		不能用
					for (int i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		void resize(size_t n, const T& val = T())
		{
			if (n <= size())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
		}

		void push_back(const T& x)
		{
			//if (_finish == _endofstorage)
			//{
			//	//size_t sz = size();		// size提前记录
			//	//size_t cp = capacity() == 0 ? 4 : capacity() * 2;
			//	//T* tmp = new T[cp];
			//	//if (_start)				// 判断顺序表是否为空，不为空要进行拷贝
			//	//{
			//	//	memcpy(tmp, _start, sizeof(T) * sz);
			//	//	delete[] _start;
			//	//}

			//	//_start = tmp;
			//	//_finish = _start + sz;
			//	//_endofstorage = _start + cp;
			//	reserve(capacity() == 0 ? 4 : capacity() * 2);
			//}

			//*_finish = x;
			//++_finish;

			insert(end(), x);
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());
			return _start[pos];
		}


		iterator insert(iterator pos, const T& x)
		{
			assert(pos >= _start);
			assert(pos <= _finish);

			// 涉及迭代器失效 -- 内部失效
			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;		// 记录偏移量
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;				// 更新pos
			}

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;
			return pos;
		}

		/*void erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
		}*/

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			iterator it = pos + 1;
			while (it < _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;
			return pos;
		}

	private:
		iterator _start;
		iterator _finish;
		iterator _endofstorage;
	};
}

4.练习题

题目链接：https://leetcode.cn/problems/letter-combinations-of-a-phone-number/

class Solution
{
    const char* numStrArr[10] = {"", "", "abc", "def", "ghi", "jkl", "mno", "pqrs", "tuv", "wxyz"};
public:
    void Combine(const string& digits, int i, string combineStr, vector<string>& ret)
    {
        if (i == digits.size())
        {
            ret.push_back(combineStr);
            return;
        }

        int num = digits[i] - '0';
        string str = numStrArr[num];        // 取到数字对应的字符串
        for (auto ch : str)
        {
            Combine(digits, i + 1, combineStr + ch, ret);
        }
    }

    vector<string> letterCombinations(const string& digits) 
    {
        vector<string> v;               // 返回的字符串数组
        if (digits.empty())
            return v;                   // 当digits为空时返回数组

        string combineStr;              // 完成组合的字符串
        Combine(digits, 0, combineStr, v);
        return v;
    }
};