STL篇五:map和set

前言

  map和set的底层是红黑树,希望大家看完前一篇文章后再来看本章内容。

1. 关联式容器

  在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?
  关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。

2.键值对

  用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。
  SGI-STL中关于键值对的定义:

template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;
	T1 first;
	T2 second;
	pair() : first(T1()), second(T2())
	{}
	pair(const T1& a, const T2& b) : first(a), second(b)
	{}
};

3.树形结构的关联式容器

  根据应用场景的不同,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。

3.1 set的介绍

set的文档介绍

  1. set是按照一定次序存储元素的容器
  2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
  3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
  5. set在底层是用二叉搜索树(红黑树)实现的。

注意:

  1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
  2. set中插入元素时,只需要插入value即可,不需要构造键值对。
  3. set中的元素不可以重复(因此可以使用set进行去重)。
  4. 使用set的迭代器遍历set中的元素,可以得到有序序列
  5. set中的元素默认按照小于来比较
  6. set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
  7. set中的元素不允许修改
  8. set中的底层使用二叉搜索树(红黑树)来实现

  它的使用方式与平衡二叉树一样,只是优化了单支树的问题。

3.2 map的介绍

map的文档介绍

  1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
  2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair<const key, T> value_type;
  3. 在内部,map中的元素总是按照键值key进行比较排序的。
  4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
  5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
  6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

  总结:

  1. map中的的元素是键值对
  2. map中的key是唯一的,并且不能修改
  3. 默认按照小于的方式对key进行比较
  4. map中的元素如果用迭代器去遍历,可以得到一个有序的序列
  5. map的底层为平衡搜索树(红黑树),查找效率比较高 O ( l o g 2 N ) O(log_2 N) O(log2N)
  6. 支持[]操作符,operator[]中实际进行插入查找

3.3 multiset的介绍

multiset的文档介绍

  1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的
  2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
  3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
  4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
  5. multiset底层结构为二叉搜索树(红黑树)。

注意:

  1. multiset中再底层中存储的是<value, value>的键值对
  2. mtltiset的插入接口中只需要插入即可
  3. 与set的区别是,multiset中的元素可以重复,set是中value是唯一的
  4. 使用迭代器对multiset中的元素进行遍历,可以得到有序的序列
  5. multiset中的元素不能修改
  6. 在multiset中找某个元素,时间复杂度为 O ( l o g 2 N ) O(log_2 N) O(log2N)
  7. multiset的作用:可以对元素进行排序

3.4 multimap的介绍

multimap的文档介绍

  1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key, value>,其中多个键值对之间的key是可以重复的。
  2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
  3. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
  4. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
  5. multimap在底层用二叉搜索树(红黑树)来实现。

  注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。
  set实际上就是排序+去重,map则是通过K值找V值。而它们的另一种multi都是将它们的去重功能给去掉了。

4.封装

  接下来要做的就是将红黑树封装成map和set。
  不过在此之前先来介绍一个结构体:pair在这里插入图片描述
pair的文档介绍
  它就是一个结构体,里面有两个成员变量。在这里插入图片描述
  接下来我们就来看红黑树的封装。那么第一个问题就来了,我们实现的红黑树是<K,V>结构,而set是< K >结构,map是<K,V>结构,这要如何进行区分呢?这是从底层上看的,在外层看就是你是传< K >,还是传<K,V>,也就是传一个参数还是传两个参数。
  而此时对于<K,V>我们就可以用一个pair来存放,如此封装一下它就变成了传一个模板参数了。一个是< K >,另一个是pair<K,V>。(此时这里的pair<K,V>是一个整体噢,参数是一个pair类型)
  而现在就将问题转化成了:给模板参数传的都是一个,只是类型不同。而此时我们的红黑树还是<K,V>结构,所以我们就要修改一下我们的模板参数。

template<class T>
struct RBTreeNode
{
	RBTreeNode<T>* _left;
	RBTreeNode<T>* _right;
	RBTreeNode<T>* _parent;
	T _data;

	Colour _col;

	RBTreeNode(const T& data)
		:_left(nullptr)
		,_right(nullptr)
		,_parent(nullptr)
		,_data(data)
		,_col(RED)
	{}
};

  将原来的<K,V>改成< T >,因为我们已经将问题转化成了都是传一个模板参数的问题,所以可以用类模型让编译器自己推到传的是< K >,还是pair<K,V>。
  但是问题又来了,我们之前在比较大小的时候是已经知道它是< K >,还是<K,V>结构了,因此可以直接比较大小,但是现在的类型可能是< K >,也可能是pair<K,V>,它们两个的比较方式是不同的(虽然pair中也是实现了比较功能,但是与这个地方的比较逻辑不太符合)。因此我们还需要处理内部比较数据大小的问题。那就需要再介绍一个知识点了——仿函数。

4.1 仿函数

  仿函数的作用是用来在特定场合处理数据用的,它是一个类,类中只实现了()的重载,其功能可以根据不同的问题来书写代码(其实在C++模板进阶中示例代码中的比较函数,就是一种仿函数,它的功能是用来处理数据的比较)。比如拿上面的问题来说,我们现在是因为同一份代码中由于传入的数据类型不一样,而导致了在与数据比较时无法正常进行。比如传入的K是int,比较多数据是int,这没问你,而如果类型是pair呢?它怎么跟int,类型比较?
  因此我们可以实现一个仿函数,让它可以返回自己的内部数据,K的话就返回K就好了,如果是pair的话就返回pair中的第一个成员变量。

namespace WY
{
	template<class K>
	class set
	{
	public:
		struct SetKeyOfT
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};
	private:
		RBTree<K, K, SetKeyOfT> _t;
	};
}

namespace WY
{
	template<class K, class V>
	class map
	{
	public:
		struct MapKeyOfT
		{
			const K& operator()(const pair<K, V>& kv)
			{
				return kv.first;
			}
		};
		
	private:
		RBTree<K, pair<const K, V>, MapKeyOfT> _t;
	};
}

  有人可能会疑惑为什么在传模板参数的时候还要再传一个K,明明传一个它们本身的类型,再传一个它们的仿函数不就可以了吗?为什么还要传一个K呢?

  这是因为对于map中,如果想要查找一个数据,一般都是通过K,来查找V的,因此它的查找函数的形参就是K类型的,所以在这里还需要将pair中的第一个成员变量的类型再传一次。而set中也传仅仅是为了与map保持形式上的一致罢了。

// set->RBTree<K, K, SetKeyOfT> _t;
// map->RBTree<K, pair<const K, T>, MapKeyOfT> _t;
template<class K, class T, class KeyOfT>
class RBTree
{
	Node* cur = _root;
	Node* parent = nullptr;
	
	//仿函数的对象
	KeyOfT kot;

	while (cur)
	{
		//这里通过仿函数就可以很好的处理数据类型不同无法比较的问题了
		if (kot(cur->_data) < kot(data))
		{
			parent = cur;
			cur = cur->_right;
		}
		else if (kot(cur->_data) > kot(data))
		{
			parent = cur;
			cur = cur->_left;
		}
		else
		{
			return make_pair(cur, false);
		}
	}
}

  因为重载的是(),在使用时就像是调用函数一样,所以叫做仿函数。

4.2 迭代器封装

  主要是需要说一下迭代器++的实现,其他部分与list迭代器封装相差无几。
  ++实际上也就是要模拟一下中序的过程,我们来分析几种过程。

  1. 当前节点右孩子为空,并且它是它父亲节点的左孩子,那么++之后就是它的父亲节点。
    在这里插入图片描述
  2. 当前节点的右孩子为空,并且它是它父亲节点的右孩子,那么++之后应该是…看图吧,文字描述太费劲…,图中的数字就是中序遍历它们的顺序,从小到大。当前节点是5,它++之后应该就是节点6,也就是不断往上走,直到当前节点是它父亲节点的左孩子在这里插入图片描述
  3. 当前节点的右孩子不为空,直接找到右子树中的最左节点就好了。在这里插入图片描述
      代码:
Self& operator++()
	{
		if (_node->_right == nullptr)
		{
			Node* cur = _node;
			Node* parent = cur->_parent;

			while (parent && parent->_right == cur)
			{
				cur = parent;
				parent = parent->_parent;
			}
			_node = parent;
		}
		else
		{
			// 下一个就是右子树的最左节点
			Node* cur = _node->_right;
			while (cur->_left)
			{
				cur = cur->_left;
			}

			_node = cur;
		}

		return *this;
	}

4.3 map的operator[ ]

V& operator[](const K& key)
	{
		pair<iterator, bool> ret = insert(make_pair(key, V()));
		return ret.first->second;
	}

  如果当前值不存在,那么就插入当前值;如果存在就返回当前值(K)所对应的(V)的引用。

5.代码实现

  这里我只张贴经过修改后的部分,其他没改过的代码就不在这里呈现了。

5.1 MySet.h

#pragma once
#include"RBTree.h"

namespace WY
{
	template<class K>
	class set
	{
	public:
		struct SetKeyOfT
		{
			const K& operator()(const K& key)
			{
				return key;
			}
		};

		typedef typename RBTree<K, K, SetKeyOfT>::const_iterator iterator;
		typedef typename RBTree<K, K, SetKeyOfT>::const_iterator const_iterator;

		iterator begin() const
		{
			return _t.begin();
		}

		iterator end() const
		{
			return _t.end();
		}

		pair<iterator, bool> insert(const K& key)
		{
			return _t.insert(key);
		}

	private:
		RBTree<K, K, SetKeyOfT> _t;
	};
}

5.2 MyMap.h

#pragma once
#include"RBTree.h"

namespace WY
{
	template<class K, class V>
	class map
	{
	public:
		struct MapKeyOfT
		{
			const K& operator()(const pair<K, V>& kv)
			{
				return kv.first;
			}
		};

		typedef typename RBTree<K, pair<const K, V>, MapKeyOfT>::iterator iterator;
		typedef typename RBTree<K, pair<const K, V>, MapKeyOfT>::const_iterator const_iterator;

		iterator begin()
		{
			return _t.begin();
		}

		iterator end()
		{
			return _t.end();
		}

		V& operator[](const K& key)
		{
			pair<iterator, bool> ret = insert(make_pair(key, V()));
			return ret.first->second;
		}

		pair<iterator, bool> insert(const pair<K, V>& kv)
		{
			return _t.insert(kv);
		}

	private:
		RBTree<K, pair<const K, V>, MapKeyOfT> _t;
	};
}

5.3 RBTree.c

template<class T>
struct RBTreeNode
{
	RBTreeNode<T>* _left;
	RBTreeNode<T>* _right;
	RBTreeNode<T>* _parent;
	T _data;

	Colour _col;

	RBTreeNode(const T& data)
		:_left(nullptr)
		,_right(nullptr)
		,_parent(nullptr)
		,_data(data)
		,_col(RED)
	{}
};

template<class T,class Ref,class Ptr>
struct __Treeiterator
{
	typedef RBTreeNode<T> Node;
	typedef __Treeiterator<T, Ref, Ptr> Self;
	Node* _node;

	__Treeiterator(Node* node)
		:_node(node)
	{}

	Ref operator*()
	{
		return _node->_data;
	}
	
	Ptr operator->()
	{
		return &_node->_data;
	}

	Self& operator++()
	{
		if (_node->_right == nullptr)
		{
			Node* cur = _node;
			Node* parent = cur->_parent;

			while (parent && parent->_right == cur)
			{
				cur = parent;
				parent = parent->_parent;
			}
			_node = parent;
		}
		else
		{
			// 下一个就是右子树的最左节点
			Node* cur = _node->_right;
			while (cur->_left)
			{
				cur = cur->_left;
			}

			_node = cur;
		}

		return *this;
	}

	bool operator!=(const Self& s)
	{
		return _node != s._node;
	}

	bool operator==(const Self& s)
	{
		return _node == s._node;
	}

};


// set->RBTree<K, K, SetKeyOfT> _t;
// map->RBTree<K, pair<const K, T>, MapKeyOfT> _t;
template<class K, class T, class KeyOfT>
class RBTree
{
	typedef RBTreeNode<T> Node;
public:
	typedef __Treeiterator<T, T&, T*> iterator;
	typedef __Treeiterator<T, const T&, const T*> const_iterator;

	iterator begin()
	{
		Node* cur = _root;
		while (cur->_left)
		{
			cur = cur->_left;
		}

		return cur;
	}

	iterator end()
	{
		return nullptr;
	}

	const_iterator begin() const
	{
		Node* cur = _root;
		while (cur->_left)
		{
			cur = cur->_left;
		}

		return cur;
	}

	const_iterator end() const
	{
		return nullptr;
	}

	pair<Node*, bool> insert(const T& data)
	{
		if (_root == nullptr)
		{
			_root = new Node(data);
			_root->_col = BLACK;
			return make_pair(_root,true);
		}

		Node* cur = _root;
		Node* parent = nullptr;
		KeyOfT kot;

		while (cur)
		{
			if (kot(cur->_data) < kot(data))
			{
				parent = cur;
				cur = cur->_right;
			}
			else if (kot(cur->_data) > kot(data))
			{
				parent = cur;
				cur = cur->_left;
			}
			else
			{
				return make_pair(cur, false);
			}
		}
		
		cur = new Node(data);
		Node* newnode = cur;

		if (kot(parent->_data) > kot(data))
		{
			parent->_left = cur;
			cur->_parent = parent;
		}
		else
		{
			parent->_right = cur;
			cur->_parent = parent;
		}

		while (parent && parent->_col == RED)
		{
			Node* uncle = nullptr;
			Node* grandparent = parent->_parent;

			if (parent == grandparent->_left)
			{
				uncle = grandparent->_right;
			}
			else
			{
				uncle = grandparent->_left;
			}

			//叔叔存在且为红
			if (uncle && uncle->_col == RED)
			{
				parent->_col = uncle->_col = BLACK;
				grandparent->_col = RED;

				cur = grandparent;
				parent = cur->_parent;
			}
			//叔叔不存在或者存在且为黑
			else
			{
				if (parent == grandparent->_left && cur == parent->_left)
				{
					//右旋
					RotateR(grandparent);
					parent->_col = BLACK;
					grandparent->_col = RED;
				}
				else if (parent == grandparent->_left && cur == parent->_right)
				{
					//先左旋,再右旋
					RotateL(parent);
					RotateR(grandparent);
					cur->_col = BLACK;
					grandparent->_col = RED;
				}
				else if (parent == grandparent->_right && cur == parent->_right)
				{
					//左旋
					RotateL(grandparent);
					parent->_col = BLACK;
					grandparent->_col = RED;
				}
				else
				{
					//先右旋,再左旋
					RotateR(parent);
					RotateL(grandparent);
					cur->_col = BLACK;
					grandparent->_col = RED;
				}
				break;
			}
		}
		_root->_col = BLACK;
		return make_pair(newnode,true);
	}
}

总结

  关于红黑树的封装,比较复杂,它是一层又套了一层,所以看起来比较混乱,但是仔细了解其中的过程之后就会发现其实也不过如此,对于封装的部分,在后面的哈希封装时还会再梳理一次。希望本章内容能对大家有所帮助。
  如果大家发现有什么错误的地方或者有什么问题,可以私信或者评论区指出喔。我会继续深入学习C++,希望能与大家共同进步,那么本期就到此结束,让我们下期再见!!觉得不错可以点个赞以示鼓励!!

  • 23
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
引用\[1\]中的代码展示了如何使用std::unordered_map来创建一个键值对的容器,并使用Print函数打印出容器中的元素。其中,m1是一个std::unordered_map对象,包含了键值对{1, 10}, {2, 20}, {3, 30}。通过调用Print函数,我们可以看到容器中的元素被正确地打印出来。 引用\[2\]中的内容介绍了std::set和std::map中的lower_bound和upper_bound函数。lower_bound函数返回setmap中第一个大于等于给定值的迭代器,而upper_bound函数返回第一个大于给定值的迭代器。这两个函数的设计可能与我们对lower和upper的理解有所不同,但是它们的功能是根据给定值在容器中查找元素的位置。 引用\[3\]中的代码展示了如何使用迭代器来遍历std::unordered_map容器中的元素。通过使用begin函数获取起始迭代器,然后使用end函数获取结束迭代器,我们可以使用迭代器来遍历容器中的所有元素。在代码中,使用了两种类型的迭代器,即普通迭代器和常量迭代器,分别用于修改和只读访问容器中的元素。 综上所述,std::map和std::setC++标准库中的关联容器,它们提供了不同的功能和特性,可以根据具体的需求选择使用。 #### 引用[.reference_title] - *1* *3* [std::unordered_map](https://blog.csdn.net/TimerSea/article/details/128067616)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [STL中std::set、std::map的lower_bound和upper_bound](https://blog.csdn.net/qq_41883523/article/details/115798756)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不如小布.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值