C++ STL详解(二) ------------- vector 模拟实现

 

目录

1.vector的介绍

2.接口总览

vector私有成员变量理解:

3.提前使用到的函数 

①size() 返回vector中有效数据个数

②capicity 返回vector中的最大容量

③swap 交换两个对象的数据                                                                    

4.默认成员函数

①构造函数1 : 无参构造

②构造函数2: 构造含有N个值为val的数据。

③构造函数3:使用一段迭代器区间进行对象的构造。

④拷贝构造(深浅拷贝)

⑤赋值构造

⑥析构函数   

5.迭代器相关函数

①begin 和 end

②迭代器的使用(遍历)

6.vector容量和大小相关函数

①reserve

②resize 

③empty

7.vector内容修改函数

①push_back (尾插)

 ②pop_back (尾删)

③insert(任意位置插入,不建议使用,效率低)

④erase(任意位置删除,不建议使用) 

8.vector的访问

重载operator[]  :支持下标访问

9.迭代器失效问题

①概念

②对于vector可能会导致其迭代器失效的操作有:

③以下代码的功能是删除vector中所有的偶数,请问那个代码是正确的,为什么?  

④总结


        

1.vector的介绍

①vector是表示可变大小数组的序列容器。
②vector就像数组一样,也采用的连续空间来存储元素,这也意味着可以采用下标对vector的元素进行访问。
③vector与普通数组不同的是,vector的大小是可以动态改变的,会被容器自动处理。
④当vector需要重新分配大小时,其做法是,开辟一个新的数组,然后将全部元素移到这个数组当中,并释放原来的空间。
⑤vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因此存储空间比实际需要的存储空间一般更大。不同的库采用不同的策略权衡空间的使用和重新分配,以至于在末尾插入一个元素的时候是在常数的时间复杂度完成的。
⑥由于vector采用连续的空间来存储元素,与其他动态序列容器相比,vector在访问元素的时候更加高效,在其末尾添加和删除元素相对高效,而对于不在其末尾进行的删除和插入操作效率则相对较低。

                

                

2.接口总览

namespace XM
{
	//模拟实现vector
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;  
		typedef const T* const_iterator;

		//默认成员函数
		vector();                                           //构造函数
		vector(size_t n, const T& val);                     //构造函数

		template<class InputIterator>                      
		vector(InputIterator first, InputIterator last);    //构造函数

		vector(const vector<T>& v);                         //拷贝构造函数
		vector<T>& operator=(const vector<T>& v);           //赋值运算符重载函数
		~vector();                                          //析构函数

		//迭代器相关函数
		iterator begin();
		iterator end();
		const_iterator begin()const;
		const_iterator end()const;

		//容量和大小相关函数
		size_t size()const;
		size_t capacity()const;
		void reserve(size_t n);
		void resize(size_t n, const T& val = T());
		bool empty()const;

		//容器内容修改相关函数
		void push_back(const T& x);
		void pop_back();
		void insert(iterator pos, const T& x);
		iterator erase(iterator pos);
		void swap(vector<T>& v);

		//访问容器相关函数
		T& operator[](size_t i);
		const T& operator[](size_t i)const;

	private:
		iterator _start;        //指向容器的头
		iterator _finish;       //指向有效数据的尾
		iterator _endofstorage; //指向容器的尾
	};
}

注:我们的类名字和库里面的冲突,所以放在自己的命名空间中。

vector私有成员变量理解:

                                

                        

3.提前使用到的函数 

①size() 返回vector中有效数据个数

size_t size()const
{
	return _finish - _start; //返回容器当中有效数据的个数
}

②capicity 返回vector中的最大容量

size_t capacity()const
{
	return _endofstorage - _start; //返回当前容器的最大容量
}

③swap 交换两个对象的数据

//交换两个容器的数据
void swap(vector<T>& v)
{
	//交换容器当中的各个成员变量
	::swap(_start, v._start);       //::调用全局的swap
	::swap(_finish, v._finish);
	::swap(_endofstorage, v._endofstorage);
}

注意: 在此处调用库当中的swap需要在swap之前加上“::”(作用域限定符),告诉编译器这里优先在全局范围寻找swap函数,否则编译器会认为你调用的就是你正在实现的swap函数(就近原则)。 

                         

                                                                

4.默认成员函数

①构造函数1 : 无参构造

	vector()
			: _start(nullptr)
			, _finish(nullptr)
			,_endofstorage(nullptr)
		{}

                                         

②构造函数2: 构造含有N个值为val的数据。

//构造函数2
vector(size_t n, const T& val = T())
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	reserve(n); //提前开辟好空间,调用reserve函数将容器容量设置为

	while(n--) //尾插n个值为val的数据到vector当中
	push_back(val);
}

注意:

(1)该构造函数知道其需要用于存储n个数据的空间,所以最好用reserve函数一次性开辟好空间,避免调用push_back函数时需要增容多次,导致效率降低。
(2)该构造函数还需要实现两个重载函数

                                                

vector(long n, const T& val = T())
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	reserve(n); 

	while(n--)
	push_back(val);
	
}


vector(int n, const T& val = T())
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	reserve(n); 

	while(n--)
	push_back(val);
	
}

 可以看到,这两个重载函数与之不同的就是其参数n的类型不同,但这是必要的,否则当我们使用以下代码时,编译器会优先与构造函数3相匹配。并且因为构造函数3当中对参数first和last进行了解引用(而int类型不能进行解引用操作)而报错。

                                                         

③构造函数3:使用一段迭代器区间进行对象的构造。

因为该迭代器区间可以是其他容器的迭代器区间,因此函数接收到的迭代器的类型是不确定的,所以我们这里需要将该构造函数设计为一个函数模板,在函数体内将该迭代器区间的数据一个个尾插到容器当中。

template<class InputIterator> 
vector(InputIterator first, InputIterator last)
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	//将迭代器区间在[first,last)的数据一个个尾插到容器当中
	while (first != last)
	{
		push_back(*first);
		first++;
	}
}

                                         

④拷贝构造(深浅拷贝)

(1)传统写法

//传统写法
vector(const vector<T>& v)
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	_start = new T[v.capacity()]; //开辟一块和容器v大小相同的空间
	for (size_t i = 0; i < v.size(); i++) //将容器v当中的数据一个个拷贝过来
	{
		_start[i] = v[i];
	}

	_finish = _start + v.size(); //容器有效数据的tail
	_endofstorage = _start + v.capacity(); //整个容器空间的tail
}

                                         

 图片解析来自:2021dragon

 总结:T是内置类型(int)或浅拷贝自定义类型(Date),他们增容或者拷贝构造中,我们用memcpy是没有问题的但是T是深拷贝的自定类型(string),他们增容或者拷贝构造中,我们用memcpy是有问题的。

                                        

(2)现代写法

//现代写法
vector(const vector<T>& v)
	:_start(nullptr)
	, _finish(nullptr)
	, _endofstorage(nullptr)
{
	reserve(v.capacity()); //调用reserve函数将容器容量设置为与v相同
	for (auto& e : v) //引用减少拷贝
	{
		push_back(e);
	}
}

                                        

⑤赋值构造

(1)传统写法

vector<T>& operator=(const vector<T>& v)
{
	if (this != &v) //防止自己给自己赋值
	{
		delete[] _start; //释放原来的空间
		_start = new T[v.capacity()]; //开辟一块和容器v大小相同的空间
		for (size_t i = 0; i < v.size(); i++) //将容器v当中的数据一个个拷贝过来
		{
			_start[i] = v[i];
		}

		_finish = _start + v.size(); //容器有效数据的tail
		_endofstorage = _start + v.capacity(); //整个容器的tail
	}

	return *this; //支持连续赋值
}

                                 

(2)现代写法

这种现代写法非常妙,首先在传参时并没有使用引用传参,因为这样可以间接调用vector的拷贝构造函数生成一份临时的对象,然后将这个拷贝构造出来的对象v与本对象的数据进行交换,此时就相当于完成了赋值操作,函数执行完之后,而对象v自动析构。

vector<T>& operator=(vector<T> v) //一份临时对象
{
	swap(v); //交换这两个对象
	return *this; //支持连续赋值
}

                                

⑥析构函数

~vector()
{
	if (_start) //避免对空指针进行释放
	{
		delete[] _start; //释放动态开辟的空间
		_start = nullptr; 
		_finish = nullptr; 
		_endofstorage = nullptr; 
	}
}

                               

                 

5.迭代器相关函数

typedef  T*  iterator;
typedef  const T*  const_iterator;         

①begin 和 end

// 能读能写
iterator begin()
{
	return _start; //返回容器的首地址
}
iterator end()
{
	return _finish; //返回容器当中有效数据的下一个数据的地址
}

//只能读
const_iterator begin()const
{
	return _start; 
}

const_iterator end()const
{
	return _finish; 
}

                                 

②迭代器的使用(遍历)

//1.正常遍历
vector<string> v(5, "mi");
vector<string>::iterator it = v.begin();

while (it != v.end())
{
	cout << *it << " ";
	it++;
}

cout << endl;



//2.范围for最终被替换为迭代器

vector<int> v(5, "mi");
for (auto e : v)
{
	cout << e << " ";
}
cout << endl;

注意:

                              

                                                 

6.vector容量和大小相关函数

①reserve

reserve规则:
 1、当n大于对象当前的capacity时,将capacity扩大到n或大于n。
 2、当n小于对象当前的capacity时,什么也不做。

void reserve(size_t n)
{
	if (n > capacity()) //空间大小是否满足
	{
		size_t sz = size(); //记录当前容器当中有效数据的个数
		T* tmp = new T[n]; //开辟一块可以容纳n个数据的空间
		if (_start) //vector是否为空
        {
			for (size_t i = 0; i < sz; i++) //将vector当中的数据一个个拷贝到tmp当中
			{
				tmp[i] = _start[i];
			}
			delete[] _start; //将vector本身存储数据的空间释放
		}

		_start = tmp; //将tmp所维护的数据交给_start进行维护
		_finish = _start + sz; //更新
		_endofstorage = _start + n; //更新
	}
}

在reserve函数的实现当中需要注意:
(1)在进行操作之前需要提前记录当前容器当中有效数据的个数
因为我们最后需要更新_finish指针的指向,_finish = _start + sz,当_start改变后我们再调用size函数通过_finish - _start计算出的数值就是一个
随机值了。 

                                   

(2)拷贝vector当中的数据时,不能使用memcpy函数进行拷贝。
可能你会想,当vector当中存储的是string的时候,虽然使用memcpy函数reserve出来的容器与原容器当中每个对应的string成员都指向同一个字符串空间,但是原容器存储数据的空间不是已经被释放了,相当于现在只有一个容器维护这这些字符串空间,这还有什么影响。但是不要忘了,当你释放原vector空间的时候,原容器当中存储的每个string在释放时会调用string的析构函数,将其指向的字符串也进行释放,所以使用memcpy函数reserve出来的容器当中的每一个string所指向的字符串实际上是一块已经被释放的空间,访问该容器时就是对内存空间进行非法访问。

(3)reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。

                                                                        

②resize 

resize规则:
 1、当n大于当前的size时,将size扩大到n,扩大的数据为val,若val未给出,则默认为容器所存储类型的默认构造函数所构造出来的值。
 2、当n小于当前的size时,将size缩小到n。

void resize(size_t n, const T& val = T())  //T类型的缺省值,调用自己的构造函数
{
	if (n < size()) //当n小于当前的size时
	{
		_finish = _start + n; //将size缩小到n
	}
	else //当n大于当前的size时
	{
		if (n > capacity()) //判断是否需要增容
		{
			reserve(n);
		}

		while (_finish < _start + n) //将size扩大到n
		{
			*_finish = val;
			_finish++;
		}
	}
}

                                 

③empty

bool empty() const
{
	return _start == _finish;
}

                

                

7.vector内容修改函数

①push_back (尾插)

void push_back(const T& x)
{
	if (_finish == _endofstorage) //判断是否需要增容
	{
		size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity(); //将容量扩大为原来的两倍
		reserve(newcapacity); //增容
	}

	*_finish = x; //尾插数据
	_finish++; //_finish指针后移
}
  • capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。 这个问题经常会考察,不要固化的认为,顺序表增容都是2倍,具体增长多少是根据具体的需求定义 的。vs是PJ版本STL,g++是SGI版本STL。(增长的倍数大了可能造成空间的浪费,倍数增长小了可能会进行多次增容,效率低)
                

 ②pop_back (尾删)

void pop_back()
{
	assert(!empty()); //vector为空则报错
	_finish--; //_finish指针前移
}

                         

③insert(任意位置插入,不建议使用,效率低)

//在pos位置插入数据
void insert(iterator pos, const T& x)
{
	if (_finish == _endofstorage) //判断是否需要增容
	{
		size_t len = pos - _start; //记录pos与_start之间的间隔,相差元素个数
		size_t newcapacity = capacity() == 0 ? 4 : 2 * capacity(); //将容量扩大为原来的两倍
		reserve(newcapacity); //增容
		pos = _start + len; //更新pos位置,通过len找到pos在增容后的容器当中的位置
	}

	//将pos位置及其之后的数据统一向后挪动一位,以留出pos位置进行插入
	iterator end = _finish;
	while (end > pos + 1)
	{
		*end = *(end - 1);
		end--;
	}

	*pos = x; //将数据插入到pos位置
	_finish++; //数据个数增加一个,_finish后移
}

注意: 若需要增容,_start指向新的空间,pos和_start 的相对位置发生了改变,需要在增容前记录pos与_start之间的间隔,更新pos的位置,然后通过该间隔确定在增容后的容器当中pos的指向,否则pos还指向原来被释放的空间。

                        

④erase(任意位置删除,不建议使用) 

//删除pos位置的数据
iterator erase(iterator pos)
{
	assert(!empty()); //vector为空则报错
	//将pos位置之后的数据统一向前挪动一位,以覆盖pos位置的数据

	iterator it = pos;
	while (it < (_finish-1))
	{
		*it = *(it+1);
		it++;
	}
	_finish--; //数据个数减少一个,_finish前移

	return pos;
}

8.vector的访问

重载operator[]  :支持下标访问

T& operator[](size_t i)
{
	assert(i < size()); //检测下标的合法性

	return _start[i]; //返回对应数据
}

const T& operator[](size_t i)const
{
	assert(i < size()); //检测下标的合法性

	return _start[i]; //返回对应数据
}

                                

                                

9.迭代器失效问题

①概念

迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装。因此 迭代器失效,实际就是迭代器底层对应指针所指向的 空间被销毁了,而使用一块已经被释放的空间 ,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。
                                        

对于vector可能会导致其迭代器失效的操作有:

(1). 会引起其底层空间改变的操作,都有可能是迭代器失效( 变成了野指针 ),比如:resize、reserve、insert、 push_back等.
#include <iostream>
using namespace std;
#include <vector>
int main()
{
 vector<int> v{1,2,3,4,5,6};
 
 auto it = v.begin();
 
 // 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
 // v.resize(100, 8);
 
 // reserve的作用就是改变扩容大小但不改变有效元素个数,操作期间可能会引起底层容量改变
 // v.reserve(100);
 
 // 插入元素期间,可能会引起扩容,而导致原空间被释放
 // v.insert(v.begin(), 0);
 // v.push_back(8);

 while(it != v.end())
 {
 cout<< *it << " " ;
 ++it;
 }

 cout<<endl;
 return 0; 
 }
出错原因:以上操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉, 而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的 空间,而引起代码运行时崩溃。
解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新赋值即可。
解决方案:
#include <iostream>
#include <algorithm>
#include <vector>
using namespace std;

int main()
{
	vector<int> v;
	v.push_back(5);
	v.push_back(6);
	v.push_back(7);
	v.push_back(8);
	v.push_back(9);
    v.push_back(10);
	//v: 5 6 7 8 9 10

	vector<int>::iterator pos = find(v.begin(), v.end(), 7); //获取值为7的元素的迭代器
	v.insert(pos, 77); //在值为7的元素的位置插入77
	//v: 5 6 77 7 8 9 10

	pos = find(v.begin(), v.end(), 7); //重新获取值为7的元素的迭代器
	v.erase(pos); //删除元素7
	//v: 5 6 77 8 9 10
	return 0;
}

                                                                        

(2)指定位置元素的删除操作--erase

#include <iostream>
using namespace std;
#include <vector>
int main()
{
 int a[] = { 1, 2, 3, 4 };
 vector<int> v(a, a + sizeof(a) / sizeof(int));

 // 使用find查找3所在位置的iterator
 vector<int>::iterator pos = find(v.begin(), v.end(), 3);

 // 删除pos位置的数据,导致pos迭代器失效。
 v.erase(pos);

 cout << *pos << endl; // 此处会导致非法访问
 return 0; 
}

// pos的意义变了,两次指向不同的值,虽然是同—块空间,但是意义可能不—样 

erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是 没有元素的,那么pos就失效了。因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效 了。

                

③以下代码的功能是删除vector中所有的偶数,请问那个代码是正确的,为什么?  

#include <iostream>
using namespace std;
#include <vector>

int main()
{
 vector<int> v{ 1, 2, 3, 4 };
 auto it = v.begin();
 while (it != v.end())
 {
 if (*it % 2 == 0)
 v.erase(it);
 ++it;
 }
 
 return 0; 
}


int main()
{
 vector<int> v{ 1, 2, 3, 4 };
 auto it = v.begin();
 while (it != v.end())
 {
 if (*it % 2 == 0)
 it = v.erase(it);
 else
 ++it;
 }
 return 0; 
}

                 

④总结

迭代器失效解决办法:在使用前,对迭代器重新赋值即可

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值