C++的map和set介绍

Jk_Mr

已于 2024-07-20 22:55:10 修改

阅读量772

点赞数 10

分类专栏： # C++中的数据结构 C++ 文章标签： c++ rpc 开发语言

于 2024-07-20 22:51:07 首次发布

本文链接：https://blog.csdn.net/Jk_Mr/article/details/140539294

版权

C++ 同时被 2 个专栏收录

22 篇文章 0 订阅

订阅专栏

C++中的数据结构

7 篇文章 1 订阅

订阅专栏

在这里插入图片描述

系列文章目录

二叉树搜索树
 map和set习题

前言

vector、list是序列式容器。本章介绍的是关联式容器map和set.它们的底层是用红黑树实现的。
关于怎么使用这里俩个容器，实际上和string一样。我们只介绍要注意的地方。

一、关联式容器

在初阶阶段，我们已经接触过STL中的部分容器，比如：vector、list、deque、forward_list(C++11)等，这些容器统称为序列式容器，因为其底层为线性序列的数据结构，里面存储的是元素本身。那什么是关联式容器？它与序列式容器有什么区别？

关联式容器也是用来存储数据的，与序列式容器不同的是，其里面存储的是<key, value>结构的键值对，在数据检索时比序列式容器效率更高。

键值对

用来表示具有一一对应关系的一种结构，该结构中一般只包含两个成员变量key和value，key代表键值，value表示与key对应的信息。比如：现在要建立一个英汉互译的字典，那该字典中必然有英文单词与其对应的中文含义，而且，英文单词与其中文含义是一一对应的关系，即通过该应该单词，在词典中就可以找到与其对应的中文含义。

STL库中有关于键值对：
pair
在这里插入图片描述

SGI-STL中关于键值对的定义:

template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;
	T1 first;
	T2 second;
pair(): first(T1()), second(T2())
{}
pair(const T1& a, const T2& b): first(a), second(b)
{}
};

二、树形结构的关联式容器

根据应用场景的不桶，STL总共实现了两种不同结构的管理式容器：树型结构与哈希结构。树型结构的关联式容器主要有四种：map、set、multimap、multiset。这四种容器的共同点是：使用平衡搜索树(即红黑树)作为其底层结果，容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

2.1 set

2.1.1 set的介绍

set文档介绍
翻译:

set是按照一定次序存储元素的容器
在set中，元素的value也标识它(value就是key，类型为T)，并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const)，但是可以从容器中插入或删除它们。
在内部，set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
set容器通过key访问单个元素的速度通常比unordered_set容器慢，但它们允许根据顺序对子集进行直接迭代。
set在底层是用二叉搜索树(红黑树)实现的。

注意：

与map/multimap不同，map/multimap中存储的是真正的键值对<key, value>，set中只放value，但在底层实际存放的是由<value, value>构成的键值对。
set中插入元素时，只需要插入value即可，不需要构造键值对(pair(T1,T2))。
set中的元素不可以重复(因此可以使用set进行去重)。
使用set的迭代器遍历set中的元素，可以得到有序序列
set中的元素默认按照小于来比较
set中查找某个元素，时间复杂度为： $log_2 n$
set中的元素不允许修改(为什么?)
set中的底层使用二叉搜索树(红黑树)来实现。

既然set式默认按照小于来比较的，那么有什么办法按照大于来比较呢？
在这里插入图片描述
Compare仿函数比较器默认使用的式less<T>. 二叉树搜索树时我们使用的是:

if (cur->_data < data)
			//比根大往右找
			cur = cur->_right;
else if (cur->_data > data)
			//比根小往左找
			cur = cur->_left;

实际上将逻辑反过来就可以按照大于来比较。

if (cur->_data > data)
			//比根小往右找
			cur = cur->_right;
else if (cur->_data < data)
			//比根大往左找
			cur = cur->_left;

2.1.3 set的使用

set的模板参数列表:|

T: set中存放元素的类型，实际在底层存储<value, value>的键值对。
Compare：set中元素默认按照小于来比较.
Alloc：set中元素空间的管理方式，使用STL提供的空间配置器管理.
set的构造

函数声明	功能介绍
set (const Compare& comp = Compare(), const Allocator&= Allocator() );	构造空的set
set (InputIterator first, InputIterator last, constCompare& comp = Compare(), const Allocator& =Allocator() );	用[first, last)区间中的元素构造set
set ( const set<Key,Compare,Allocator>& x);	set的拷贝构造

set的迭代器

函数声明	功能介绍
iterator begin()	返回set中起始位置元素的迭代器
iterator end()	返回set中最后一个元素后面的迭代器
const_iterator cbegin()const	返回set中起始位置元素的const迭代器
const_iterator cend() const	返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin()	返回set第一个元素的反向迭代器，即end
reverse_iterator rend()	返回set最后一个元素下一个位置的反向迭代器，即rbegin
const_reverse_iterator crbegin() const	返回set第一个元素的反向const迭代器，即cend
const_reverse_iterator crend() const	返回set最后一个元素下一个位置的反向const迭代器，即crbegin

set的容量

函数声明	功能介绍
bool empty ( ) const	检测set是否为空，空返回true，否则返回true
size_type size() const	返回set中有效元素的个数

set修改操作

函数声明	功能介绍
pair<iterator,bool> insert (const value_type& x )	在set中插入元素x，实际插入的是<x, x>构成的键值对，如果插入成功，返回<该元素在set中的位置，true>,如果插入失败，说明x在set中已经存在，返回<x在set中的位置，false>
void erase ( iterator position )	删除set中position位置上的元素
size_type erase ( const key_type& x )	删除set中值为x的元素，返回删除的元素的个数
void erase ( iterator first, iterator last )	删除set中[first, last)区间中的元素
void swap (set<Key,Compare,Allocator>& st );	交换set中的元素
void clear ( )	将set中的元素清空
iterator find ( const key_type& x ) const	返回set中值为x的元素的位置
size_type count ( const key_type& x ) const	返回set中值为x的元素的个数

set的使用举例

删除节点

删除最小的节点：

#include <set>
#include <iostream>
using namespace std;

int main()
{
    set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);

    //迭代器遍历
    set<int>::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " "; it++;
    }
    cout << endl;

    //删除最小元素,就是最左边的节点，即begin()
    s.erase(s.begin());

    //范围for遍历
    for (auto x : s) 
        cout << x << " "; 
    cout << endl;
}

如果使用值方式去删除时，删除元素存在就会删除，不存在不做处理。可以使用删除函数的返回值进行判断是否删除成功。
在这里插入图片描述

set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
    set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
    //迭代器遍历
    set<int>::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " "; it++;
    }
    cout << endl;
    int x;
    cin >> x;
    int num = s.erase(x);
    if (num == 0)
        cout << "删除元素不存在" << endl;
    //范围for遍历
    for (auto x : s) 
        cout << x << " "; 
    cout << endl;

在这里插入图片描述
如果使用find()来删除，元素不存在则会报错，find()找到了会返回这个位置的迭代器，没有找到会返回end();

    set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);

    //迭代器遍历
    set<int>::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " "; it++;
    }
    cout << endl;
    //find删除
    s.erase(s.find(30));
    //范围for遍历
    for (auto x : s) 
        cout << x << " "; 
    cout << endl;
    s.erase(s.find(1));

在这里插入图片描述
所以使用find时最好使用:

 //find删除
 auto pos = s.find(30);
 if(pos !=s.end())
 {
     s.erase(pos);
 }
 else
 	cout << "元素不存在" << endl;

find的不同效率

搜索二叉树中的find 和普通算法中的find效率不一样。
搜索二叉树中的是按照它的规则来的效率是 O(log₂N).
而普通算法遍历的是迭代器，效率是:O(N)

count举例

#include <set>
void TestSet()
{
	// 用数组array中的元素构造set
	int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 };
	set<int> s(array, array+sizeof(array)/sizeof(array));
	cout << s.size() << endl;
	// 正向打印set中的元素，从打印结果中可以看出：set可去重
	for (auto& e : s)
		cout << e << " ";
	cout << endl;
	// 使用迭代器逆向打印set中的元素
	for (auto it = s.rbegin(); it != s.rend(); ++it)
		cout << *it << " ";
	cout << endl;
	// set中值为3的元素出现了几次
	cout << s.count(3) << endl;
}

count 的效率是:O(log₂N)

lower_bound 和 upper_bound

在这里插入图片描述

lower_bound 返回 >= val 的位置。

upper_bound返回 > val 的位置。
例如:

// set::lower_bound/upper_bound
#include <iostream>
#include <set>
int main ()
{
  std::set<int> myset;
  std::set<int>::iterator itlow,itup;

  for (int i=1; i<10; i++) myset.insert(i*10); // 10 20 30 40 50 60 70 80 90

  itlow=myset.lower_bound (30);                // >= 30 的位置，即30位置
  itup=myset.upper_bound (60);                 // >60 的位置，即70的位置
	//然后删除[30,70)之间的元素
  myset.erase(itlow,itup);                     // 10 20 70 80 90

  std::cout << "myset contains:";
  for (std::set<int>::iterator it=myset.begin(); it!=myset.end(); ++it)
    std::cout << ' ' << *it;
  std::cout << '\n';

  return 0;
}

在这里插入图片描述
传的值可以不为set中的元素:

2.2 multiset

multiset和set的区别就在于multiset允许键值冗余。
它就不会去重了。相同的元素会保留下来。
那么在结构中，插入一个相同的值它会插入在哪呢？
相同的元素会集中到一块：
在这里插入图片描述
这样实际上会发生旋转，但是目前我们了解一下。到底层实现会更加清楚。
相等的值继续插入，插入在左边或者右边都可以，因为旋转后，插入在右边，也可能会旋转到左边。

2.2.1 区别：

find查找

1、find查找x时，多个x在树中，返回中序第一个x.
相等的一定是连续的:

int main()
{
	multiset<int> s; s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
	s.insert(40); s.insert(40); s.insert(40);
	for (auto x : s) cout << x << " "; cout << endl;
	auto pos = s.find(40);
	while (pos != s.end() && *pos == 40)
	{
		cout << *pos << " "; pos++;
	}
	return 0;
}

在这里插入图片描述
这里使用count就很方便.

erase删除

那么erase是全删呢，还是一个呢？
在这里插入图片描述
我们验证一下：

int main()
{
	multiset<int> s; s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
	s.insert(40); s.insert(40); s.insert(40);
	for (auto x : s) cout << x << " "; cout << endl;
	s.erase(40);
	for (auto x : s) cout << x << " "; cout << endl;
	return 0;
}

在这里插入图片描述
说明是全部删除，那么这里就有迭代器失效的问题。
删除掉元素后，之后的节点也删除了。那么迭代器++就不能获取到后面的元素。
所以C++98中的erase没有返回值:
要解决也比较简单，提前记录好删除完之后的节点即可。
C++11中有返回值：
在这里插入图片描述

equal_range

该函数，用于找到相同元素的区间。返回值值是一个键值对。键值对的第一个元素first是左区间.
第二个元素是second是右区间（相同元素的后一个）,注意是左闭右开.
在这里插入图片描述

// multiset::equal_elements
#include <iostream>
#include <set>

typedef std::multiset<int>::iterator It;  // aliasing the iterator type used
int main ()
{
  int myints[]= {77,30,16,2,30,30};
  std::multiset<int> mymultiset (myints, myints+6);  // 2 16 30 30 30 77
  std::pair<It,It> ret = mymultiset.equal_range(30); //      ^        ^

  mymultiset.erase(ret.first,ret.second);

  std::cout << "mymultiset contains:";
  for (It it=mymultiset.begin(); it!=mymultiset.end(); ++it)
    std::cout << ' ' << *it;
  std::cout << '\n';
  return 0;
}

在这里插入图片描述

2.3 map

2.3.1 map的介绍

map的文档简介

翻译：

map是关联容器，它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
在map中，键值key通常用于排序和惟一地标识元素，而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，为其取别名称为pair: typedef pair<const key, T> value_type;
在内部，map中的元素总是按照键值key进行比较排序的。
map中通过键值访问单个元素的速度通常比unordered_map容器慢，但map允许根据顺序
对元素进行直接迭代(即对map中的元素进行迭代时，可以得到一个有序的序列)。
map支持下标访问符，即在[]中放入key，就可以找到与key对应的value。
map通常被实现为二叉搜索树(更准确的说：平衡二叉搜索树(红黑树))。

2.3.2 map的使用

map的模板参数说明

key: 键值对中key的类型
T：键值对中value的类型
Compare: 比较器的类型，map中的元素是按照key来比较的，缺省情况下按照小于来比较，一般情况下(内置类型元素)该参数不需要传递，如果无法比较时(自定义类型)，需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc：通过空间配置器来申请底层空间，不需要用户传递，除非用户不想使用标准库提供的空间配置器
注意：在使用map时，需要包含头文件。
map的构造

函数声明	功能介绍
`map()`	构造一个空的map

map的迭代器

函数声明	功能介绍
begin() 和 end()	begin:首元素的位置，end最后一个元素的下一个位置
cbegin()和cend()	与begin和end意义相同，但cbegin和cend所指向的元素不能修改
rbegin()和rend()	反向迭代器，rbegin在end位置，rend在begin位置，其++和–操作与begin和end操作移动相反
crbegin()和crend()	与rbegin和rend位置相同，操作相同，但crbegin和crend所指向的元素不能修改

map的容量与元素访问

函数声明	功能介绍
bool empty ( ) const	检测map中的元素是否为空，是返回true，否则返回false
size_type size() const	返回map中有效元素的个数
mapped_type& operator[] (const key_type& k)	返回去key对应的value

问题：当key不在map中时，通过operator获取对应value时会发生什么问题？
在这里插入图片描述
注意：在元素访问时，有一个与operator[]类似的操作at()(该函数不常用)函数，都是通过key找到与key对应的value然后返回其引用，不同的是：当key不存在时，operator[]用默认value与key构造键值对然后插入，返回该默认value，at()函数直接抛异常。

map中元素的修改

函数声明	功能介绍
pair<iterator,bool> insert ( const value_type& x )	在map中插入键值对x，注意x是一个键值对，返回值也是键值对：iterator代表新插入元素的位置，bool代表释放插入成功
void erase ( iterator position )	删除position位置上的元素
size_type erase ( const key_type& x )	删除键值为x的元素
void erase ( iterator first, iterator last )	删除[first, last)区间中的元素
void swap ( map<Key,T,Compare,Allocator>& mp )	交换两个map中的元素
void clear ( )	将map中的元素清空
iterator find ( const key_type& x )	在map中插入key为x的元素，找到返回该元素的位置的迭代器，否则返回end
const_iterator find ( const key_type& x ) const	在map中插入key为x的元素，找到返回该元素的位置的const迭代器，否则返回cend
size_type count ( const key_type& x ) const	返回key为x的键值在map中的个数，注意map中key是唯一的，因此该函数的返回值要么为0，要么为1，因此也可以用该函数来检测一个key是否在map中

构造map对象

由于map对象是使用键值对的方式进构建的，所以有以下几种构建方式：

map<string, string> dict1;
pair<string, string> kv1("left","左边");		//有名对象初始化
dict1.insert(kv1);		
dict1.insert(pair<string, string>("right", "右边"));		//匿名对象初始化
dict1.insert(make_pair("insert","插入"));		//make_pair初始化
dict1.insert({ "string", "字符串" });	//初始化列表初始化，多参数构造隐式类型转化

map<string, string> dict2{ {"up","上面"},{"down","下面"}};	//initializer list初始化

使用迭代器迭代map对象

由于键值对pair没有支持 <<和>>的重载。
所以使用下面方式进行迭代是不行的：

	//map<string,string>::iterator it = dict1.begin();
	auto it = dict1.begin();
	while (it != dict1.end())
	{
		cout << (*it) << endl;
		it++;
	}

但是pair支持获取到它的俩个成员first 和 second:

	map<string, string> dict1;
	pair<string, string> kv1("left","左边");		//有名对象初始化
	dict1.insert(kv1);		
	dict1.insert(pair<string, string>("right", "右边"));		//匿名对象初始化
	dict1.insert(make_pair("insert","插入"));		//make_pair初始化
	dict1.insert({ "string", "字符串" });	//初始化列表初始化，多参数构造隐式类型转化
	map<string, string> dict2{ {"up","上面"},{"down","下面"}};	//initializer list初始化
	//map<string,string>::iterator it = dict1.begin();
	auto it = dict1.begin();
	while (it != dict1.end())
	{
		cout << (*it).first << ":" << (*it).second << endl;
		it++;
	}

结果：
在这里插入图片描述
可以发现同样是按照字典序的排序方式进行输出。
当时使用最多的是使用it->first和it->second.调用的是迭代器模式的，operator->()
使用范围for注意要使用& ,因为全是深拷贝,所以要高效率.

for(const auto& e : dict1)
{
	cout << e.first << ":" << e.second << endl;
}

C++17 以后可以如下进行遍历:

for(auto& [x,y]  : dict1)
{
	cout << x << ":" << y  << endl;
}

模型举例

这样之后就可以创建kv模型(简单字典):

int main()
{
	map<string, string> dict1;
	pair<string, string> kv1("left", "左边");		//有名对象初始化
	dict1.insert(kv1);
	dict1.insert(pair<string, string>("right", "右边"));		//匿名对象初始化
	dict1.insert(make_pair("insert", "插入"));		//make_pair初始化
	dict1.insert({ "string", "字符串" });	//初始化列表初始化，多参数构造隐式类型转化

	string str;
	while (cin >> str)
	{
		auto ret = dict1.find(str);
		if (ret != dict1.end())
			cout << "->" << ret->second << endl;
		else
			cout << "没有该单词" << endl;
	}
	return 0;
}

在这里插入图片描述
也可以统计次数:

int main()
{
	// 统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countTree;
	for (const auto& str : arr)
	{
		// 先查找水果在不在搜索树中
		// 1、不在，说明水果第一次出现，则插入<水果, 1>
		// 2、在，则查找到的节点中水果对应的次数++
		//map<string, int>* ret = countTree.find(str);
		auto ret = countTree.find(str);
		if (ret == countTree.end())
			countTree.insert({ str, 1 });
		else
			ret->second++;
	}
	for (const auto& e : countTree)
	{
		cout << e.first << ":" << e.second << endl;
	}
	return 0;
}

在这里插入图片描述

map中的`operator[]`和 `at()`

opeartor[]:
翻译:
如果k与容器中某个元素的键匹配，则函数返回其映射值的引用。

如果k与容器中任何元素的键都不匹配，则函数插入一个带有该键的新元素，并返回其映射值的引用。请注意，即使没有为该元素分配映射值（该元素使用其默认构造函数构造），这始终会使容器的大小增加一个。

一个类似的成员函数，map::at，在键存在的情况下具有相同的行为，但在键不存在时会引发异常。

调用此函数等同于： (*((this->insert(make_pair(k, mapped_type()))).first)).second
在这里插入图片描述
我们只需要传k,而它调用insert使用了匿名对象. C++对内置类型进行升级,int()默认是初始化为0

使用了insert()的返回值:

在这里插入图片描述
翻译返回值解释:
单元素版本（1）返回一对值，其中其成员pair::first被设置为指向新插入元素或映射中具有等效键的元素的迭代器。pair::second元素设置为true，如果插入了新元素，则设置为true，如果等效键已经存在，则设置为false。

也就是说:
1.插入成功,指向新插入的节点,bool为true
2.插入失败,指向相同元素的节点,bool为false
在这里插入图片描述
有了这一个特性,那么operator[]就可以获取到该元素的value:

类似于:

V& operator[](const K& key)
{
	pair<iterator,bool> ret = insert(make_pair(key,V()));
	iterator it = ret.first;
	return it->second;
}

那么下面的程序就是使用了该特性

int main()
{
	map<string, string> dict;
	dict.insert(make_pair("left", "左边"));
	// 查找
	cout << dict["left"] << endl;

	// 插入 + 修改
	dict["right"] = "右边"; 
	// 查找
	cout << dict["right"] << endl;

	// 修改
	dict["left"] = "左边、剩余";
	// 查找
	cout << dict["left"] << endl;

	//插入
	dict["insert"];
	// 查找
	cout << dict["insert"] << endl;

	return 0;
}

在这里插入图片描述
可以通过调试窗口进行查看.

int main()
{
	// 统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countTree;
	for (const auto& str : arr)
		countTree[str]++;
	for (const auto& e : countTree)
		cout << e.first << ":" << e.second << endl;
	return 0;
}

在这里插入图片描述

2.4 multimap

multimap文档介绍
翻译：

Multimaps是关联式容器，它按照特定的顺序，存储由key和value映射成的键值对<key,value>，其中多个键值对之间的key是可以重复的。
在multimap中，通常按照key排序和惟一地标识元素，而映射的value存储与key关联的内容。key和value的类型可能不同，通过multimap内部的成员类型value_type组合在一起，value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
在内部，multimap中的元素总是通过其内部比较对象，按照指定的特定严格弱排序标准对key进行排序的。
multimap通过key访问单个元素的速度通常比unordered_multimap容器慢，但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
multimap在底层用二叉搜索树(红黑树)来实现。

注意：multimap和map的唯一不同就是：map中的key是唯一的，而multimap中key是可以重复的。

int main()
{
	map<string,string> dict;
	dict.insert(make_pair("sort","排序"));
	dict.insert(make_pair("sort","xxx"));//插入失败不会进行修改

	multimap<string,string> dict2;
	dict.insert(make_pair("sort","排序"));
	dict.insert(make_pair("sort","xxx"));//插入成功,属于新增的节点
	dict.insert(make_pair("sort","排序"));//插入成功,属于新增的节点
	
	return 0;
}

所以multimap不提供operator[]
有多个key,不知道返回哪个.

如果你有所收获,可以留下你的点赞和关注,谢谢你的观看!!!

Jk_Mr

关注

10
点赞
踩
30

收藏

觉得还不错? 一键收藏
1
评论
C++的map和set介绍

vectorlist是序列式容器。本章介绍的是关联式容器map和set.它们的底层是用红黑树实现的。关于怎么使用这里俩个容器，实际上和string一样。我们只介绍要注意的地方。set文档介绍set是按照一定次序存储元素的容器在set中，元素的value也标识它(value就是key，类型为T)，并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const)，但是可以从容器中插入或删除它们。
复制链接

扫一扫