[C++]set和map的介绍及使用

        关于set和map的接口函数部分,只重点介绍一些相较于别的容器有特殊地方的接口,set和map的接口可以触类旁通。

一、概念

(一)、关联式容器

        关联式容器存储的元素是一个个的键值对<key,value>通过键(key)可以快速索引到其对应的value值。关联容器可以快速查找、读取或者删除所存储的元素,同时该类型的容器插入元素的效率比序列容器(如vector)高。

(二)、键值对

        键值对用来表示具有一一对应关系的一种结构,该结构中只包含两个成员变量key和value,key代表键值,value表示与key对应的信息,可以通过键值key快速索引到其对应的信息value。比如说英汉词典,查询单词的中文释义就需要通过英文单词快速索引到中文释义,这里的键key是英文单词,key的类型为string,key对应的信息value是中文释义,value的类型也为string,这样,英文单词和中文释义就构成了一个<string,string>的键值对。

        键值对可以用pair类来表示,pair是C++的STL提供的一个类。pair - C++ Reference (cplusplus.com)icon-default.png?t=N7T8https://legacy.cplusplus.com/reference/utility/pair/        pair存储了公有的两个成员变量,一个叫做first,一个叫做second,可以在外部访问,这两个成员变量的类型通过用户指定。我们可以用pair的first存储键key,用second存储key对应的信息value。

(三)、关联式容器的结构

        根据应用场景的不同,STL总共实现了两种不同结构的关联式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:map、set、multimap、multiset。这四种容器的共同点是:使用平衡二叉搜索树(红黑树)作为其底层结果,容器中的元素是一个有序的序列,迭代器遍历得到的是一个有序的序列。

二、set和multiset

(一)set

set - C++ Reference (cplusplus.com)icon-default.png?t=N7T8https://legacy.cplusplus.com/reference/set/set/

set的简介

模板类型

template <

           class T,                                        // set::key_type/value_type

           class Compare = less<T>,         // set::key_compare/value_compare

           class Alloc = allocator<T>         // set::allocator_type

               >

T:set存储的元素类型。

Compare:仿函数,用于提供元素之间的比较方法。

Alloc:空间配置器

1、set是按照特定次序存储的没有重复元素的容器。

2、在set中,一个元素value就对应其本身的值(value本身就是键key,类型为T),并且每个元素在set中必须是不能重复的set中元素的值在容器中不能被再次修改(元素的类型总是const类型),但是可以从容器中插入或删除。

3、在内部,set中的元素总是按照其内部比较对象(类型为Compare)所指示的特定严格弱排序标准进行排序。

4、set容器在通过key访问单个元素时通常比unordered_set容器慢,但set迭代到的序列是有序的。

5、set通常以平衡二叉搜索树的形式实现。

set的接口

1、插入insert

        对于set的insert,第一个(single element)和第三个(range)版本的插入最常用,而中间的第二个(with hint)版本不是很常用,这个接口并不是在指定位置插入,而是在插入时提供一个接近最终插入的位置的迭代器,对插入元素时的效率进行优化,但这种优化效果并不总是显著的,因为用户提示不好,则会忽略用户的提示从头开始搜索插入位置进行插入,且红黑树的平衡性会影响搜索提示时的效率。

        注意到第一个(single element)版本的insert的返回值不是指向新插入位置的迭代器,而是pair<iterator,bool>类型。因为set中的元素都是唯一的,set不允许插入已经存在的元素,若插入的元素存在时,则插入失败,将返回一个pair<iterator,bool>的对象,其first成员为指向set中现有元素位置的迭代器,second成员bool值为false表示插入失败若插入的元素不存在,其first成员为指向新插入元素位置的迭代器,second成员bool值为true,表示插入成功。

代码例子:

#include <iostream>
#include <set>
using namespace std;

int main()
{
	set<int> s;

	int arr[] = { 2,3,5,6,7,1,2,0,5};

	//将arr的元素依次插入到s中
	for (auto e : arr)
	{
		auto ret = s.insert(e);
		if (ret.second == false)//插入失败
		{
			cout << *(ret.first) << "已存在,插入失败。" << endl;
		}
	}

	//打印s的元素
	for (auto e : s)
	{
		cout << e << " ";
	}
	
	return 0;
}

运行结果: 

2已存在,插入失败。
5已存在,插入失败。
0 1 2 3 5 6 7

2、查找并计数count
        这个函数的功能是在容器中搜索与val相等的元素,并返回匹配次数。因为每个元素在set中都是唯一的,所以返回值只能为0和1。如果只想查找某个元素在不在set容器内,可以考虑不使用find函数而使用count函数,如果返回值为1,那么存在,为0则不存在。

代码例子:

int main()
{
	set<int> s;

	int arr[] = {1,2,3,4,5,6,7,8,9,10};
	
	for (auto e : arr)
	{
		s.insert(e);
	}

	//查找某个值在不在s中
	int x;
 
	//方法1:使用find函数
	cin >> x;
	auto it = s.find(x);
	if (it != s.end())
		cout << *it << "存在!" << endl;
	else
		cout << x << "不存在" << endl;

	cout << endl;

	//方法2,使用count函数
	cin >> x;
	if (s.count(x))
		cout << x << "存在" << endl;
	else
		cout << x << "不存在" << endl;

	return 0;
}
3、lower_bound和upper_bound

lower_bound:得到下界

        指定一个值x,返回一个迭代器,该迭代器指向容器中的第一个满足条件的元素,条件是该元素大于或等于x。如果使用默认比较类型 (less) 实例化 set 类,则该函数将返回一个迭代器,该迭代器指向的值不小于x。

upper_bound:得到上界

        指定一个值y,返回一个迭代器,该迭代器指向容器中的第一个满足条件的元素,条件是该元素大于y。如果使用默认比较类型 (less) 实例化 set 类,则该函数将返回一个迭代器,该迭代器指向的值大于y。

        通过上面两个函数可以获得到两个迭代器,当x < y 时,这两个迭代器维护一个区间,区间范围是[x,y),左闭右开,可以用于删除指定范围的子序列。

代码例子:

int main()
{
	std::set<int> myset;
	std::set<int>::iterator itlow, itup;

	for (int i = 1; i < 10; i++) myset.insert(i * 10); // 10 20 30 40 50 60 70 80 90

	//删除区间位于 [25,65) 的元素 
	itlow = myset.lower_bound(25);     //找到第一个大于等于25的元素,这里是30
	itup = myset.upper_bound(65);      //找到第一个大于65的元素,这里是70 

	//删除对应迭代器区间的元素[itlow,itup)
	myset.erase(itlow, itup);                     // 10 20 70 80 90

	std::cout << "myset contains:";
	for (std::set<int>::iterator it = myset.begin(); it != myset.end(); ++it)
		std::cout << ' ' << *it;
	std::cout << '\n';

	return 0;
}

运行结果:

myset contains: 10 20 70 80 90
 

 4、equal_range

        功能:指定一个值val,返回一对迭代器,该迭代器维护着一段区间,该区间内的元素的值都为相同,为val。由于set的元素是唯一的,所以该区间内最多只能有一个元素。若val值不存在,两个迭代器都指向位于val之后的第一个元素。

代码例子:

int main()
{
	std::set<int> myset;

	for (int i = 1; i <= 5; i++) myset.insert(i * 10);   // myset: 10 20 30 40 50

	std::pair<std::set<int>::const_iterator, std::set<int>::const_iterator> ret;
	ret = myset.equal_range(30);

	std::cout << "the lower bound points to: " << *ret.first << '\n';
	std::cout << "the upper bound points to: " << *ret.second << '\n';

	return 0;
}

运行结果: 

the lower bound points to: 30
the upper bound points to: 40

 

(二)multiset

multiset - C++ Reference (cplusplus.com)icon-default.png?t=N7T8https://legacy.cplusplus.com/reference/set/multiset/        multiset功能和set相似,但是multiset允许元素有冗余,可以存储多个相同的元素,而set里的每个元素都是唯一的。这里直接介绍multiset和set使用上的不同。

1、insert

        因为multise允许有重复的数据,所以用insert插入数据时不会存在插入失败的情况,其返回值不是pair<iterator,bool>类型,而直接就是iterator类型。

2、erase

        如果通过erase删除值为value的元素,那么在容器中所有与value相等的元素都会被删除。

代码例子:

int main()
{
	multiset<int> myMultiset;

	int arr[] = { 10,10,20,20,20,30,40,50,60 };

	for (auto e : arr)
	{
		myMultiset.insert(e);
	}

	for (auto e : myMultiset)
	{
		cout << e << " ";
	}

	cout << endl;
	cout << "删除20" << endl;
	myMultiset.erase(20);

	for (auto e : myMultiset)
	{
		cout << e << " ";
	}
	return 0;
}

运行结果: 

10 10 20 20 20 30 40 50 60
删除20
10 10 30 40 50 60

3、count 

        由于元素在multise中不再唯一,count的返回值是大于等于0的。

int main()
{
	multiset<int> myMultiset;

	int arr[] = { 10,10,20,20,20,30,40,50,60 };

	for (auto e : arr)
	{
		myMultiset.insert(e);
	}

	for (auto e : myMultiset)
	{
		cout << e << " ";
	}

	cout << endl;

	cout << "20出现了" << myMultiset.count(20) << "次" << endl;
	return 0;
}

运行结果: 

10 10 20 20 20 30 40 50 60
20出现了3次
 

4、lower_bound和upper_bound

        功能和上面介绍的set的lower_bound和upper_bound一样,不过lower_bound和upper_bound在multiset用得更多一些。

代码例子:

int main()
{
	multiset<int> myMultiset;

	int arr[] = { 10,10,20,20,20,30,40,50,60,60,60,70,80,90,100};

	//插入数据
	for (auto e : arr)
	{
		myMultiset.insert(e);
	}

	//打印
	for (auto e : myMultiset)
	{
		cout << e << " ";
	}
	cout << endl;

	//删除区间位于 [25,65) 的元素 
	auto itlow = myMultiset.lower_bound(25);     //找到第一个大于等于25的元素,这里是30
	auto itup = myMultiset.upper_bound(65);      //找到第一个大于65的元素,这里是70 

	myMultiset.erase(itlow, itup);

	for (auto e : myMultiset)
	{
		cout << e << " ";
	}

	return 0;
}

运行结果:

10 10 20 20 20 30 40 50 60 60 60 70 80 90 100
10 10 20 20 20 70 80 90 100

 5、equal_range

        功能和上面介绍的set的equal_range一样,不过equal_range在multiset用得更多一些,可以得到一个迭代器区间,该区间内的元素都和指定key相同。

代码例子:

int main()
{
	multiset<int> myMultiset;

	int arr[] = { 10,10,20,20,20,30,40,50,60,60,60,70,80,90,100 };

	//插入数据
	for (auto e : arr)
	{
		myMultiset.insert(e);
	}

	//打印
	for (auto e : myMultiset)
	{
		cout << e << " ";
	}
	cout << endl;

	//得到重复元素60的迭代器区间
	pair<multiset<int>::iterator, multiset<int>::iterator> ret = myMultiset.equal_range(60);

	//删除
	myMultiset.erase(ret.first, ret.second);

	//打印
	for (auto e : myMultiset)
	{
		cout << e << " ";
	}
	cout << endl;
	return 0;
}

运行结果:

10 10 20 20 20 30 40 50 60 60 60 70 80 90 100
10 10 20 20 20 30 40 50 70 80 90 100

三、map和multimap

(一)map

map - C++ Reference (cplusplus.com)icon-default.png?t=N7T8https://legacy.cplusplus.com/reference/map/map/

map的简介

模板类型

template <

           class Key,                                     // map::key_type

           class T,                                       // map::mapped_type

           class Compare = less<Key>,                     // map::key_compare

           class Alloc = allocator<pair<const Key,T> >    // map::allocator_type

           >

key:键key的类型。

T:映射值value的类型。

Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)

Alloc:空间配置器

1、map是一种关联容器,用于存储由键key和映射值value组合而成的元素,按照特定顺序存储。

2、在map中,键值通常用于对元素进行排序和唯一标识,而映射值存储与此键相关的内容。键和映射值的类型可以不同,键和映射值在成员中用一个value_type类型的变量组合在一起,value_type是将两者组合在一起的pair类型:typedef pair<const Key, T> value_type;

3、在内部,映射中的元素总是按照其内部比较对象(类型为Compare)所指示的特定严格弱排序标准的键进行排序。

4、map容器在通过键key访问单个元素时通常比unordered_map容器慢,但map迭代到的序列是有序的。

5、map中的映射值value可以使用括号操作符((operator[])通过对应的键key直接访问到。

6、map通常以二叉搜索树的形式实现。

map的接口 

1、插入insert

        map存储的元素类型是pair<K,V>类型,插入元素时需要传入pair<K,V>类型的对象进行插入。

插入例子:

void test1()
{
	//英汉词典
	map<string, string> dict;

	//插入方法1:实例化pair对象插入
	pair<string, string> kv1("abandon", "v.放弃");
	dict.insert(kv1);

	//插入方法2:构造函数生成匿名对象
	dict.insert(pair<string, string>("ability", "n. 能力; 才能"));

	//插入方法3:使用make_pair函数返回pair类型变量
	dict.insert(make_pair("able", "a. 能够;有能力的"));

	//插入方法4:多参数构造函数的类型转换
	pair<string, string> kv2 = { "abnormal"," a. 不正常的" };
	dict.insert(kv2);
	dict.insert({ "abnormal"," a. 不正常的" });

	//插入方法5: 初始化列表initializer_list + 多参数构造函数的类型转换
	initializer_list<pair<const string, string>> l = { {"aboard","ad.在船、飞机上"} ,{"abolish","v.废除"},{"about","ad. 大约;到处;四处"} };
	dict.insert(l);
	dict.insert({ {"aboard","ad.在船、飞机上"} ,{"abolish","v.废除"},{"about","ad. 大约;到处;四处"} });

	//打印词库
	for (auto& e : dict)
	{
		cout << e.first << " -> " << e.second << endl;
	}
}

void test2()
{
    //插入方法5: 初始化列表initializer_list + 多参数构造函数的类型转换
	//一步到位
	//英汉词典
	map<string, string> dict = { {"abandon", "v.放弃"},
		{"ability", "n. 能力; 才能"},
		{"abnormal"," a. 不正常的"},
		{"aboard","ad.在船、飞机上"},
		{"abolish","v.废除"},
		{"about","ad. 大约;到处;四处"}
	};

	//打印词库
	for (auto& e : dict)
	{
		cout << e.first << " -> " << e.second << endl;
	}
}

int main()
{
	test1();
	cout << endl;
	test2();
	
	return 0;
}

运行结果:

abandon -> v.放弃
ability -> n. 能力; 才能
able -> a. 能够;有能力的
abnormal ->  a. 不正常的
aboard -> ad.在船、飞机上
abolish -> v.废除
about -> ad. 大约;到处;四处

abandon -> v.放弃
ability -> n. 能力; 才能
abnormal ->  a. 不正常的
aboard -> ad.在船、飞机上
abolish -> v.废除
about -> ad. 大约;到处;四处
 

2、下标访问operator[]和at

        功能:使map可以像数组通过下标访问到数据一样,通过对应的键key访问到其对应映射的值value。

        如果key与容器中元素的键匹配,则该函数将返回对其映射值的引用。
        如果key与容器中任何元素的键不匹配,则该函数将插入一个该键的新元素,并返回对其映射值的引用。请注意, 本操作会让容器大小增加 1,即使没有为该元素分配映射值来初始化(该新元素会在构造时使用映射值类型的默认构造进行初始化),

        功能:和operator[]功能类似,通过键key访问其映射值,返回key对应的映射值的引用。但是,如果键key不存在,则会抛异常。 

代码例子:

int main()
{
	//统计选民的投票次数
	string arr[] = { "张三","李四","张三","李四","王某","王某","李四","李四","王某" };

	//键:名字 映射值:投票次数
	map<string, int> count;

	//计数
	for (auto& e : arr)
	{
		//通过名字索引对应的投票次数并加一,代表投票次数加一
		//如果该名字不在count里,则用该名字作为key新插入一个元素,其映射值使用的是int内置类型的默认构造,其值为0
		count[e]++; 
	}

	//打印选民和对应的投票次数
	for (auto e : count)
	{
		cout << e.first << " -> " << e.second << endl;
	}

	return 0;
}

运行结果:

李四 -> 4
王某 -> 3
张三 -> 2
 

3、其他接口

        map的count、lower_bound、upper_bound以及equal_range的功能和set的是一样的,其功能在set部分已经着重介绍过了,这里不再赘述。 

(二)、multimap

        multimap和map功能类似,这里也不再赘述。需要注意的是multimap允许元素冗余,容器中可以存在多个相同key的元素,并且multimap中没有重载operator[]和at操作,因为multimap中可以有多个相同的key对应不同的映射值,使用operator[]的话返回值的类型应该是一个引用映射值的数组,这样的话会使内存更加复杂化,如果需要得到所有相同key的元素,可以通过equal_range得到这个集合的迭代器区间,这样更加简洁。

  • 18
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值