C++的map和set介绍

在这里插入图片描述

系列文章目录

二叉树搜索树
map和set习题



前言

vectorlist是序列式容器。本章介绍的是关联式容器mapset.它们的底层是用红黑树实现的。
关于怎么使用这里俩个容器,实际上和string一样 。我们只介绍要注意的地方。


一、关联式容器

在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面 存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?

关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高

键值对

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量keyvaluekey代表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。

STL库中有关于键值对:
pair
在这里插入图片描述

SGI-STL中关于键值对的定义:

template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;
	T1 first;
	T2 second;
pair(): first(T1()), second(T2())
{}
pair(const T1& a, const T2& b): first(a), second(b)
{}
};

二、树形结构的关联式容器

根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:mapsetmultimapmultiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

2.1 set

2.1.1 set的介绍

set文档介绍
翻译:

  1. set是按照一定次序存储元素的容器
  2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
  3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
  5. set在底层是用二叉搜索树(红黑树)实现的。

注意:

  1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
  2. set中插入元素时,只需要插入value即可,不需要构造键值对(pair(T1,T2))。
  3. set中的元素不可以重复(因此可以使用set进行去重)。
  4. 使用set的迭代器遍历set中的元素,可以得到有序序列
  5. set中的元素默认按照小于来比较
  6. set中查找某个元素,时间复杂度为: l o g 2 n log_2 n log2n
  7. set中的元素不允许修改(为什么?)
  8. set中的底层使用二叉搜索树(红黑树)来实现。

既然set式默认按照小于来比较的,那么有什么办法按照大于来比较呢?
在这里插入图片描述
Compare仿函数比较器默认使用的式less<T>. 二叉树搜索树时我们使用的是:

if (cur->_data < data)
			//比根大往右找
			cur = cur->_right;
else if (cur->_data > data)
			//比根小往左找
			cur = cur->_left;

实际上将逻辑反过来就可以按照大于来比较。

if (cur->_data > data)
			//比根小往右找
			cur = cur->_right;
else if (cur->_data < data)
			//比根大往左找
			cur = cur->_left;

2.1.3 set的使用

  1. set的模板参数列表:|
    2.
    T: set中存放元素的类型,实际在底层存储<value, value>的键值对。
    Compare:set中元素默认按照小于来比较.
    Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理.

  2. set的构造

函数声明功能介绍
set (const Compare& comp = Compare(), const Allocator&= Allocator() );构造空的set
set (InputIterator first, InputIterator last, constCompare& comp = Compare(), const Allocator& =Allocator() );用[first, last)区间中的元素构造set
set ( const set<Key,Compare,Allocator>& x);set的拷贝构造
  1. set的迭代器
函数声明功能介绍
iterator begin()返回set中起始位置元素的迭代器
iterator end()返回set中最后一个元素后面的迭代器
const_iterator cbegin()const返回set中起始位置元素的const迭代器
const_iterator cend() const返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin()返回set第一个元素的反向迭代器,即end
reverse_iterator rend()返回set最后一个元素下一个位置的反向迭代器,即rbegin
const_reverse_iterator crbegin() const返回set第一个元素的反向const迭代器,即cend
const_reverse_iterator crend() const返回set最后一个元素下一个位置的反向const迭代器,即crbegin
  1. set的容量
函数声明功能介绍
bool empty ( ) const检测set是否为空,空返回true,否则返回true
size_type size() const返回set中有效元素的个数
  1. set修改操作
函数声明功能介绍
pair<iterator,bool> insert (const value_type& x )在set中插入元素x,实际插入的是<x, x>构成的键值对,如果插入成功,返回<该元素在set中的位置,true>,如果插入失败,说明x在set中已经存在,返回<x在set中的位置,false>
void erase ( iterator position )删除set中position位置上的元素
size_type erase ( const key_type& x )删除set中值为x的元素,返回删除的元素的个数
void erase ( iterator first, iterator last )删除set中[first, last)区间中的元素
void swap (set<Key,Compare,Allocator>& st );交换set中的元素
void clear ( )将set中的元素清空
iterator find ( const key_type& x ) const返回set中值为x的元素的位置
size_type count ( const key_type& x ) const返回set中值为x的元素的个数
  1. set的使用举例
删除节点

删除最小的节点:

#include <set>
#include <iostream>
using namespace std;

int main()
{
    set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);

    //迭代器遍历
    set<int>::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " "; it++;
    }
    cout << endl;

    //删除最小元素,就是最左边的节点,即begin()
    s.erase(s.begin());

    //范围for遍历
    for (auto x : s) 
        cout << x << " "; 
    cout << endl;
}

如果使用值方式去删除时,删除元素存在就会删除,不存在不做处理。可以使用删除函数的返回值进行判断是否删除成功。
在这里插入图片描述

set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
    set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
    //迭代器遍历
    set<int>::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " "; it++;
    }
    cout << endl;
    int x;
    cin >> x;
    int num = s.erase(x);
    if (num == 0)
        cout << "删除元素不存在" << endl;
    //范围for遍历
    for (auto x : s) 
        cout << x << " "; 
    cout << endl;

在这里插入图片描述
如果使用find()来删除,元素不存在则会报错,find()找到了会返回这个位置的迭代器,没有找到会返回end();

    set<int> s; // set is a binary search tree
    s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);

    //迭代器遍历
    set<int>::iterator it = s.begin();
    while (it != s.end())
    {
        cout << *it << " "; it++;
    }
    cout << endl;
    //find删除
    s.erase(s.find(30));
    //范围for遍历
    for (auto x : s) 
        cout << x << " "; 
    cout << endl;
    s.erase(s.find(1));

在这里插入图片描述
所以使用find时最好使用:

 //find删除
 auto pos = s.find(30);
 if(pos !=s.end())
 {
     s.erase(pos);
 }
 else
 	cout << "元素不存在" << endl;
find的不同效率

搜索二叉树中的find 和 普通算法中的find效率不一样。
搜索二叉树中的是按照 它的规则来的效率是 O(log2N).
而普通算法遍历的是迭代器,效率是:O(N)

count举例
#include <set>
void TestSet()
{
	// 用数组array中的元素构造set
	int array[] = { 1, 3, 5, 7, 9, 2, 4, 6, 8, 0, 1, 3, 5, 7, 9, 2, 4, 6, 8, 0 };
	set<int> s(array, array+sizeof(array)/sizeof(array));
	cout << s.size() << endl;
	// 正向打印set中的元素,从打印结果中可以看出:set可去重
	for (auto& e : s)
		cout << e << " ";
	cout << endl;
	// 使用迭代器逆向打印set中的元素
	for (auto it = s.rbegin(); it != s.rend(); ++it)
		cout << *it << " ";
	cout << endl;
	// set中值为3的元素出现了几次
	cout << s.count(3) << endl;
}

count 的效率是:O(log2N)

lower_bound 和 upper_bound

在这里插入图片描述
在这里插入图片描述
lower_bound 返回 >= val 的位置。
在这里插入图片描述
upper_bound返回 > val 的位置。
例如:

// set::lower_bound/upper_bound
#include <iostream>
#include <set>
int main ()
{
  std::set<int> myset;
  std::set<int>::iterator itlow,itup;

  for (int i=1; i<10; i++) myset.insert(i*10); // 10 20 30 40 50 60 70 80 90

  itlow=myset.lower_bound (30);                // >= 30 的位置,即30位置
  itup=myset.upper_bound (60);                 // >60 的位置,即70的位置
	//然后删除[30,70)之间的元素
  myset.erase(itlow,itup);                     // 10 20 70 80 90

  std::cout << "myset contains:";
  for (std::set<int>::iterator it=myset.begin(); it!=myset.end(); ++it)
    std::cout << ' ' << *it;
  std::cout << '\n';

  return 0;
}

在这里插入图片描述
传的值可以不为set中的元素:
在这里插入图片描述

2.2 multiset

multisetset的区别就在于multiset允许键值冗余。
它就不会去重了。相同的元素会保留下来。
那么在结构中,插入一个相同的值它会插入在哪呢?
相同的元素会集中到一块:
在这里插入图片描述
这样实际上会发生旋转,但是目前我们了解一下。到底层实现会更加清楚。
相等的值继续插入,插入在左边或者右边都可以,因为旋转后,插入在右边,也可能会旋转到左边。

2.2.1 区别:

find查找

1、find查找x时,多个x在树中,返回中序第一个x.
相等的一定是连续的:

int main()
{
	multiset<int> s; s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
	s.insert(40); s.insert(40); s.insert(40);
	for (auto x : s) cout << x << " "; cout << endl;
	auto pos = s.find(40);
	while (pos != s.end() && *pos == 40)
	{
		cout << *pos << " "; pos++;
	}
	return 0;
}

在这里插入图片描述
这里使用count就很方便.

erase删除

那么erase是全删呢,还是一个呢?
在这里插入图片描述
我们验证一下:

int main()
{
	multiset<int> s; s.insert(10); s.insert(20); s.insert(30); s.insert(40); s.insert(50);
	s.insert(40); s.insert(40); s.insert(40);
	for (auto x : s) cout << x << " "; cout << endl;
	s.erase(40);
	for (auto x : s) cout << x << " "; cout << endl;
	return 0;
}

在这里插入图片描述
说明是全部删除,那么这里就有迭代器失效的问题。
删除掉元素后,之后的节点也删除了。那么迭代器++就不能获取到后面的元素。
所以C++98中的erase没有返回值:在这里插入图片描述
要解决也比较简单,提前记录好删除完之后的节点即可。
C++11中有返回值:
在这里插入图片描述

equal_range

该函数,用于找到相同元素的区间。返回值值是一个键值对。键值对的第一个元素first是左区间.
第二个元素是second是右区间(相同元素的后一个),注意是左闭右开.
在这里插入图片描述

// multiset::equal_elements
#include <iostream>
#include <set>

typedef std::multiset<int>::iterator It;  // aliasing the iterator type used
int main ()
{
  int myints[]= {77,30,16,2,30,30};
  std::multiset<int> mymultiset (myints, myints+6);  // 2 16 30 30 30 77
  std::pair<It,It> ret = mymultiset.equal_range(30); //      ^        ^

  mymultiset.erase(ret.first,ret.second);

  std::cout << "mymultiset contains:";
  for (It it=mymultiset.begin(); it!=mymultiset.end(); ++it)
    std::cout << ' ' << *it;
  std::cout << '\n';
  return 0;
}

在这里插入图片描述

2.3 map

2.3.1 map的介绍

map的文档简介

翻译:

  1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
  2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,keyvalue通过成员类型value_type绑定在一起,为其取别名称为pair: typedef pair<const key, T> value_type;
  3. 在内部,map中的元素总是按照键值key进行比较排序的。
  4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序
    对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
  5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
  6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

2.3.2 map的使用

  1. map的模板参数说明
    在这里插入图片描述
    key: 键值对中key的类型
    T: 键值对中value的类型
    Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
    Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器
    注意:在使用map时,需要包含头文件。

  2. map的构造

函数声明功能介绍
map()构造一个空的map
  1. map的迭代器
函数声明功能介绍
begin()end()begin:首元素的位置,end最后一个元素的下一个位置
cbegin()和cend()与begin和end意义相同,但cbegin和cend所指向的元素不能修改
rbegin()和rend()反向迭代器,rbegin在end位置,rend在begin位置,其++和–操作与begin和end操作移动相反
crbegin()和crend()与rbegin和rend位置相同,操作相同,但crbegin和crend所指向的元素不能修改
  1. map的容量与元素访问
函数声明功能介绍
bool empty ( ) const检测map中的元素是否为空,是返回true,否则返回false
size_type size() const返回map中有效元素的个数
mapped_type& operator[] (const key_type& k)返回去key对应的value

问题:当key不在map中时,通过operator获取对应value时会发生什么问题?
在这里插入图片描述
注意:在元素访问时,有一个与operator[]类似的操作at()(该函数不常用)函数,都是通过key找到与key对应的value然后返回其引用,不同的是:当key不存在时,operator[]用默认valuekey构造键值对然后插入,返回该默认value,at()函数直接抛异常

  1. map中元素的修改
函数声明功能介绍
pair<iterator,bool> insert ( const value_type& x )在map中插入键值对x,注意x是一个键值对,返回值也是键值对:iterator代表新插入元素的位置,bool代表释放插入成功
void erase ( iterator position )删除position位置上的元素
size_type erase ( const key_type& x )删除键值为x的元素
void erase ( iterator first, iterator last )删除[first, last)区间中的元素
void swap ( map<Key,T,Compare,Allocator>& mp )交换两个map中的元素
void clear ( )将map中的元素清空
iterator find ( const key_type& x )在map中插入key为x的元素,找到返回该元素的位置的迭代器,否则返回end
const_iterator find ( const key_type& x ) const在map中插入key为x的元素,找到返回该元素的位置的const迭代器,否则返回cend
size_type count ( const key_type& x ) const返回key为x的键值在map中的个数,注意map中key是唯一的,因此该函数的返回值要么为0,要么为1,因此也可以用该函数来检测一个key是否在map中
构造map对象

由于map对象是使用键值对的方式进构建的,所以有以下几种构建方式:

map<string, string> dict1;
pair<string, string> kv1("left","左边");		//有名对象初始化
dict1.insert(kv1);		
dict1.insert(pair<string, string>("right", "右边"));		//匿名对象初始化
dict1.insert(make_pair("insert","插入"));		//make_pair初始化
dict1.insert({ "string", "字符串" });	//初始化列表初始化,多参数构造隐式类型转化

map<string, string> dict2{ {"up","上面"},{"down","下面"}};	//initializer list初始化
使用迭代器迭代map对象

由于键值对pair没有支持 <<>>的重载。
所以使用下面方式进行迭代是不行的:

	//map<string,string>::iterator it = dict1.begin();
	auto it = dict1.begin();
	while (it != dict1.end())
	{
		cout << (*it) << endl;
		it++;
	}

但是pair支持获取到它的俩个成员firstsecond:

	map<string, string> dict1;
	pair<string, string> kv1("left","左边");		//有名对象初始化
	dict1.insert(kv1);		
	dict1.insert(pair<string, string>("right", "右边"));		//匿名对象初始化
	dict1.insert(make_pair("insert","插入"));		//make_pair初始化
	dict1.insert({ "string", "字符串" });	//初始化列表初始化,多参数构造隐式类型转化
	map<string, string> dict2{ {"up","上面"},{"down","下面"}};	//initializer list初始化
	//map<string,string>::iterator it = dict1.begin();
	auto it = dict1.begin();
	while (it != dict1.end())
	{
		cout << (*it).first << ":" << (*it).second << endl;
		it++;
	}

结果:
在这里插入图片描述
可以发现同样是按照字典序的排序方式进行输出。
当时使用最多的是使用it->firstit->second.调用的是迭代器模式的,operator->()
使用范围for注意要使用& ,因为全是深拷贝,所以要高效率.

for(const auto& e : dict1)
{
	cout << e.first << ":" << e.second << endl;
}

C++17 以后可以如下进行遍历:

for(auto& [x,y]  : dict1)
{
	cout << x << ":" << y  << endl;
}
模型举例

这样之后就可以创建kv模型(简单字典):

int main()
{
	map<string, string> dict1;
	pair<string, string> kv1("left", "左边");		//有名对象初始化
	dict1.insert(kv1);
	dict1.insert(pair<string, string>("right", "右边"));		//匿名对象初始化
	dict1.insert(make_pair("insert", "插入"));		//make_pair初始化
	dict1.insert({ "string", "字符串" });	//初始化列表初始化,多参数构造隐式类型转化

	string str;
	while (cin >> str)
	{
		auto ret = dict1.find(str);
		if (ret != dict1.end())
			cout << "->" << ret->second << endl;
		else
			cout << "没有该单词" << endl;
	}
	return 0;
}

在这里插入图片描述
也可以统计次数:

int main()
{
	// 统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countTree;
	for (const auto& str : arr)
	{
		// 先查找水果在不在搜索树中
		// 1、不在,说明水果第一次出现,则插入<水果, 1>
		// 2、在,则查找到的节点中水果对应的次数++
		//map<string, int>* ret = countTree.find(str);
		auto ret = countTree.find(str);
		if (ret == countTree.end())
			countTree.insert({ str, 1 });
		else
			ret->second++;
	}
	for (const auto& e : countTree)
	{
		cout << e.first << ":" << e.second << endl;
	}
	return 0;
}

在这里插入图片描述

map中的operator[]at()

opeartor[]:
翻译:
如果k与容器中某个元素的键匹配,则函数返回其映射值的引用。

如果k与容器中任何元素的键都不匹配,则函数插入一个带有该键的新元素,并返回其映射值的引用。请注意,即使没有为该元素分配映射值(该元素使用其默认构造函数构造),这始终会使容器的大小增加一个。

一个类似的成员函数,map::at,在键存在的情况下具有相同的行为,但在键不存在时会引发异常。

调用此函数等同于: (*((this->insert(make_pair(k, mapped_type()))).first)).second
在这里插入图片描述
我们只需要传k,而它调用insert使用了 匿名对象. C++对内置类型进行升级,int()默认是初始化为0

使用了insert()的返回值:

在这里插入图片描述
翻译返回值解释:
单元素版本(1)返回一对值,其中其成员pair::first被设置为指向新插入元素或映射中具有等效键的元素的迭代器pair::second元素设置为true如果插入了新元素,则设置为true,如果等效键已经存在,则设置为false

也就是说:
1.插入成功,指向新插入的节点,booltrue
2.插入失败,指向相同元素的节点,boolfalse
在这里插入图片描述
有了这一个特性,那么operator[]就可以获取到该元素的value:
在这里插入图片描述
类似于:

V& operator[](const K& key)
{
	pair<iterator,bool> ret = insert(make_pair(key,V()));
	iterator it = ret.first;
	return it->second;
}

那么下面的程序就是使用了该特性

int main()
{
	map<string, string> dict;
	dict.insert(make_pair("left", "左边"));
	// 查找
	cout << dict["left"] << endl;

	// 插入 + 修改
	dict["right"] = "右边"; 
	// 查找
	cout << dict["right"] << endl;

	// 修改
	dict["left"] = "左边、剩余";
	// 查找
	cout << dict["left"] << endl;

	//插入
	dict["insert"];
	// 查找
	cout << dict["insert"] << endl;

	return 0;
}

在这里插入图片描述
可以通过调试窗口进行查看.

int main()
{
	// 统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countTree;
	for (const auto& str : arr)
		countTree[str]++;
	for (const auto& e : countTree)
		cout << e.first << ":" << e.second << endl;
	return 0;
}

在这里插入图片描述

2.4 multimap

multimap文档介绍
翻译:

  1. Multimaps是关联式容器,它按照特定的顺序,存储由key和value映射成的键值对<key,value>,其中多个键值对之间的key是可以重复的。
  2. 在multimap中,通常按照key排序和惟一地标识元素,而映射的value存储与key关联的内容。key和value的类型可能不同,通过multimap内部的成员类型value_type组合在一起,value_type是组合key和value的键值对:typedef pair<const Key, T> value_type;
  3. 在内部,multimap中的元素总是通过其内部比较对象,按照指定的特定严格弱排序标准对key进行排序的。
  4. multimap通过key访问单个元素的速度通常比unordered_multimap容器慢,但是使用迭代器直接遍历multimap中的元素可以得到关于key有序的序列。
  5. multimap在底层用二叉搜索树(红黑树)来实现。

注意:multimap和map的唯一不同就是:map中的key是唯一的,而multimap中key是可以重复的。

int main()
{
	map<string,string> dict;
	dict.insert(make_pair("sort","排序"));
	dict.insert(make_pair("sort","xxx"));//插入失败不会进行修改

	multimap<string,string> dict2;
	dict.insert(make_pair("sort","排序"));
	dict.insert(make_pair("sort","xxx"));//插入成功,属于新增的节点
	dict.insert(make_pair("sort","排序"));//插入成功,属于新增的节点
	
	return 0;
}

所以multimap不提供operator[]
有多个key,不知道返回哪个.


如果你有所收获,可以留下你的点赞和关注,谢谢你的观看!!!

  • 10
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值