[C++](18)STL - set 和 map 的使用

set

set简介

文档介绍:set - C++ Reference (cplusplus.com)

set 是按照特定顺序存储不重复元素的容器。

在一个 set 中,一个元素的值也是它的标识(值本身就是 key,类型为 T),并且每个值必须是唯一的。set 中的元素的值不能在容器中被修改(元素是常数),但是可以从容器中插入或删除它们。

在内部,set 中的元素总是按照其内部比较对象(Compare 类型)所指示的严格弱序标准进行排序。

set 容器通过 key 来访问单个元素通常比 unordered_set 容器要慢一些,但是它们允许根据顺序对子集进行直接迭代。

set 底层是用二叉搜索树(红黑树)实现的。

set使用

void test1()
{
	set<int> s;
	s.insert(4);
	s.insert(5);
	s.insert(5);
	s.insert(2);
	s.insert(1);
	s.insert(2);
	s.insert(3);
	for (set<int>::iterator it = s.begin(); it != s.end(); ++it)
	{
		cout << *it << " ";
	}
	cout << endl;
}
//结果:1 2 3 4 5

可以看到它带有排序+去重的功能。

迭代器set 的普通迭代器和 const迭代器是一样的,都不支持修改。

查找

void test3()
{
	set<int> s;
	s.insert(4);
	s.insert(5);
	s.insert(5);
	s.insert(2);
	s.insert(1);
	s.insert(2);
	s.insert(3);

	set<int>::iterator pos = s.find(2);
	if (pos != s.end())
	{
		cout << "s.find找到了" << endl;
	}
	pos = find(s.begin(), s.end(), 2);
	if (pos != s.end())
	{
		cout << "find找到了" << endl;
	}
}
//结果:
//s.find找到了
//find找到了

set 自带 find 查找,算法库里通用的 find 也可以用。但是这两者的效率差距非常大。

set 自带的 find 会按照二叉搜索树查找规则进行查找,时间复杂度为 O ( log ⁡ n ) O(\log n) O(logn)

库里的 find 是遍历,时间复杂度为 O ( n ) O(n) O(n)

删除

void test4()
{
	set<int> s;
	s.insert(4);
	s.insert(5);
	s.insert(5);
	s.insert(2);
	s.insert(1);
	s.insert(2);
	s.insert(3);

	int x;
	while (cin >> x)
	{
		set<int>::iterator pos = s.find(x);
		if (pos != s.end())
		{
			s.erase(pos);
			cout << "删除" << x << "成功" << endl;
		}
		else
		{
			cout << x << "不在set中" << endl;
		}
	}
    for (auto e : s)
	{
		cout << e << ' ';
	}
	cout << endl;
}
//1
//删除1成功
//2
//删除2成功
//20
//20不在set中
//^Z
//3 4 5

erase 是有返回值的,表示删除数据的个数,对于 set 来说,只有 0 或 1。


使用 count 可以方便地查看某个元素在不在:

if (s.count(5))
{
	cout << "5在" << endl;
}

lower_bound、upper_bound

lower_bound 传入一个值,它会返回容器中,指向大于等于这个值的第一个元素的迭代器。

upper_bound 传入一个值,它会返回容器中,指向大于这个值的第一个元素的迭代器。

利用它们我们可以轻松获得一个迭代器区间:

void test5()
{
	set<int> s;
	s.insert(4);
	s.insert(5);
	s.insert(2);
	s.insert(1);
	s.insert(3);

	int x, y;
	cin >> x >> y;
	set<int>::iterator leftIt = s.lower_bound(x);	//返回>=x的第一个元素的迭代器
	set<int>::iterator rightIt = s.upper_bound(y);	//返回>y的第一个元素的迭代器
	s.erase(leftIt, rightIt);	//范围,[leftIt, rightIt)其实就是[x, y]
	for (auto e : s)
	{
		cout << e << ' ';
	}
	cout << endl;
}
//结果:
//2
//4
//1 5

multiset

multiset 允许插入重复数据,其接口和 set 一样。

值得注意的是:

  • multiseterase 会将某个 val 包括与其重复的元素全部删除,最后返回删除个数。

  • find 一个有重复数据的 val,会返回中序的第一个 val 元素的迭代器

map

map简介

文档介绍:map - C++ Reference (cplusplus.com)

map 是关联式容器,按照特定的顺序存储由键值(key value)和映射值(mapped value)组合形成的元素。

在一个 map 中,key values 通常用于排序和唯一识别元素,而 mapped values 则存储与此 key 相关的内容。keymapped value 的类型可能不同,在成员类型 value_type 中被组合在一起,它是一个结合两者的 pair 类型:

typedef pair<const Key, T> value_type;

在内部,一个 map 中的元素总是按照其内部比较对象(类型为 Compare)所指定的严格弱序标准按其 key 进行排序。

map 容器按 key 访问单个元素的速度通常比 unordered_map 容器要慢,但是它们允许根据顺序对子集进行直接迭代。

map 中的映射值可以使用括号运算符(operator[])和其相应的键直接访问。

map 底层是用二叉搜索树(红黑树)实现的。

关联式容器

在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别?

关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是 <key, value> 结构的键值对,在数据检索时比序列式容器效率更高

键值对

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量 key 和 value,key 代表键值,value 表示与 key 对应的信息。

SGI-STL 中关于 pair 的定义:

template <class T1, class T2>
struct pair
{
	typedef T1 first_type;
	typedef T2 second_type;
	T1 first;
	T2 second;
	pair() : first(T1()), second(T2())
	{}
	pair(const T1& a, const T2& b) : first(a), second(b)
	{}
};

你可以使用构造函数创建 pair 对象:

pair<string, string> kv("banana", "香蕉");

也可以使用函数模板 make_pair

auto kv = make_pair("cherry", "樱桃");

因为 make_pair 是函数模板,所以它能自动推导键值和映射值的类型,它的定义如下:

template <class T1,class T2>
pair<T1,T2> make_pair (T1 x, T2 y)
{
    return ( pair<T1,T2>(x,y) );
}

map使用

插入

关于插入,有以下四种方式:

void test6()
{
	map<string, string> dict;

	dict.insert(pair<string, string>("apple", "苹果"));	//匿名对象

	pair<string, string> kv("banana", "香蕉");	//普通对象
	dict.insert(kv);

	dict.insert(make_pair("cherry", "樱桃"));	//make_pair

	dict.insert({ "pear", "梨" });	//C++11
}

第四种是C++11的方法,其原理涉及到C++11的新特性,具体会在以后讲解。

遍历

键值对是不支持直接打印的,但是我们可以直接访问里面的 firstsecond 成员变量:

for (auto it = dict.begin(); it != dict.end(); ++it)
{
    cout << it->first << " : " << it->second << endl;
}
//结果:
//apple : 苹果
//banana : 香蕉
//cherry : 樱桃
//pear : 梨

简单使用

统计水果出现的次数

void test7()
{
	string str[] = { "苹果","橘子","香蕉","香蕉", "苹果","西瓜","苹果","梨","苹果","梨","苹果","橘子","苹果","香蕉" };
	map<string, int> countMap;
	for (auto& str : str)
	{
		auto it = countMap.find(str); //通过find来判断map中是否已经有了这个水果
		if (it != countMap.end())
		{
			++it->second;
		}
		else
		{
			countMap.insert(make_pair(str, 1));
		}
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << " : " << kv.second << endl;
	}
}
//结果:
//梨: 2
//苹果 : 6
//西瓜 : 1
//香蕉 : 3
//橘子 : 2

这段程序可以优化:

insert 函数原型:

pair<iterator,bool> insert (const value_type& val);

它会返回一个键值对,该键值对的 first 是一个迭代器,指向新插入的元素或 map 中与 val 相等 key 的一个元素。second 是一个 bool 值,true 表示成功插入新元素 valfalse 表示 map 中已经存在和 val 相等 key 的元素,插入失败。

优化后:

void test7()
{
	string str[] = { "苹果","橘子","香蕉","香蕉", "苹果","西瓜","苹果","梨","苹果","梨","苹果","橘子","苹果","香蕉" };
	map<string, int> countMap;
	for (auto& str : str)
	{
		auto ret = countMap.insert(make_pair(str, 1));
		if (!ret.second)
		{
			++ret.first->second;
		}
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << " : " << kv.second << endl;
	}
}
//结果:
//梨: 2
//苹果 : 6
//西瓜 : 1
//香蕉 : 3
//橘子 : 2

但这还不是最优秀的方式,最优秀的应该是用[]:

void test7()
{
	string str[] = { "苹果","橘子","香蕉","香蕉", "苹果","西瓜","苹果","梨","苹果","梨","苹果","橘子","苹果","香蕉" };
	map<string, int> countMap;
	for (auto& str : str)
	{
		++countMap[str];
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << " : " << kv.second << endl;
	}
}
//结果:
//梨: 2
//苹果 : 6
//西瓜 : 1
//香蕉 : 3
//橘子 : 2

map::operator[]

mapped_type& operator[] (const key_type& k);

如果 k 与容器中的一个元素的键相匹配,该函数返回对其映射值的引用。

如果 k 与容器中任何元素的键都不匹配,该函数将插入一个带有该键的新元素,并返回一个对其映射值的引用。请注意,即使没有给元素分配映射值,这也会使容器的大小增加一(元素是用其默认构造函数构造的)。

类似的成员函数,map::at,在有键的元素存在时有同样的行为,但在没有的时候抛出一个异常。

调用此函数相当于:

(*((this->insert(make_pair(k,mapped_type()))).first)).second

最后这一行代码可以说是很难看了,我们有必要对其分解后再理解:

mapped_type& operator[] (const key_type& k)
{
	// 原代码:
	//return (*((this->insert(make_pair(k, mapped_type()))).first)).second; 
	// 
	// 去掉显式的this指针:
	//return (*((insert(make_pair(k, mapped_type()))).first)).second; 
	//
	// 将insert函数调用提取出来,接收返回值ret:
	//pair<iterator, bool> ret = insert(make_pair(k, mapped_type())); 
	//return (*(ret.first)).second;
	// 
	// 对return返回值进行简化:
	pair<iterator, bool> ret = insert(make_pair(k, mapped_type()));
	return ret.first->second;
}

mapped_type() 就是一个匿名对象,类似于我们之前写的 T(),这里相当于给元素的映射值进行了初始化。

对于 ret,有两种情况:

  1. 如果容器中没有 keyk 的元素,则插入成功,ret.first 指向新插入的元素,ret.secondtrue
  2. 容器中已有 keyk 的元素,则插入失败,ret.first 指向已有的元素,ret.secondfalse

ret.first->second 则是新元素或已有元素的映射值

所以方括号运算符重载的底层就是复用了 insert,统计水果代码第二次优化前后底层逻辑本质上是一样的。

multimap

multimap 允许键值重复的元素存在。

multimap 使用 insert 返回类型是 iterator ,连 bool 都没有,因为它永远是插入成功的。

multimap 不支持使用 [] 访问,因为同一个键可能有多个映射值,无法区分。

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

世真

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值