《C++ Primer》学习笔记(十一):关联容器

专栏C++学习笔记

《C++ Primer》学习笔记/习题答案 总目录

——————————————————————————————————————————————————————

📚💻 Cpp-Prime5 + Cpp-Primer-Plus6 源代码和课后题

关联容器

关联容器支持高效的关键字查找和访问操作。2个主要的关联容器(associative-container)类型是 mapset

  • map 中的元素是一些键值对(key-value):关键字起索引作用,值表示与索引相关联的数据。
  • set 中每个元素只包含一个关键字,支持高效的关键字查询操作:检查一个给定关键字是否在 set 中。

标准库提供了8个关联容器,它们之间的不同体现在三个方面:

  • map 还是 set 类型。
  • 是否允许保存重复的关键字。
  • 是否按顺序保存元素。

允许重复保存关键字的容器名字都包含单词 multi;无序保存元素的容器名字都以单词 unordered 开头。
在这里插入图片描述

  • mapmultimap 类型定义在头文件 map 中;
  • setmultiset 类型定义在头文件 set 中;
  • 无序容器定义在头文件 unordered_mapunordered_set 中。

1、使用关联容器

map 类型通常被称为 关联数组(associative array)

map 中提取一个元素时,会得到一个pair类型的对象。pair 是一个模板类型,保存两个名为 firstsecond 的公有数据成员。map 所使用的 pairfirst 成员保存关键字,用 second 成员保存对应的值。

// 统计每个单词在输入中出现的次数
map<string, size_t> word_count;     // string到size_t的空map
string word;
while (cin >> word)
    ++word_count[word];     		// 提取word的计数器并将其加1
for (const auto &w : word_count)    // 对map中的每个元素
    // 打印结果
    cout << w.first << " occurs " << w.second
        << ((w.second > 1) ? " times" : " time") << endl;

set 类型的 find 成员返回一个迭代器。如果给定关键字在 set 中,则迭代器指向该关键字,否则返回的是尾后迭代器。

// 统计输入中每个单词出现的次数
map<string, size_t> word_count;
set<string> exclude = { "The", "But", "And", "Or", "An", "A",
						"the", "but", "and", "or", "an", "a" };
string word;
while (cin >> word)
	// 只统计不在exclude中的单词
	if (exclude.find(word) == exclude.end())
		++word_count[word];

2、关联容器概述

1)定义关联容器

定义 map 时,必须指定关键字类型和值类型;定义 set 时,只需指定关键字类型,因为 set 中没有值。

初始化 map 时,必须提供关键字类型和值类型,提供的每个键值对用花括号 {} 包围,{key, value}

map<string, size_t> word_count;   // 空容器
// 列表初始化
set<string> exclude = { "the", "but", "and" };
// 三个元素; authors将姓映射为名
map<string, string> authors =
{
    {"Joyce", "James"},
    {"Austen", "Jane"},
    {"Dickens", "Charles"}
};

/* ************** */

// 定义一个有20个元素的vector,保存0到9每个整数的两个拷贝
vector<int> ivec;
for (vector<int>::size_type i = 0; i != 10; ++i) {
	ivec.push_back(i);
	ivec.push_back(i); // 每个数重复保存一次
}
// iset包含来自ivec的不重复的元素; miset包含所有20个元素
set<int> iset(ivec.cbegin(), ivec.cend());
multiset<int> miset(ivec.cbegin(), ivec.cend());
cout << ivec.size() << endl; 	// 打印出20
cout << iset.size() << endl;	// 打印出10
cout << miset.size() << endl;	// 打印出20

mapset 中的关键字必须唯一,multimapmultiset 没有此限制。

2)关键字类型的要求

对于有序容器——mapmultimapsetmultiset,关键字类型必须定义元素比较的方法。默认情况下,标准库使用关键字类型的 < 运算符来进行比较操作。

传递给排序算法的可调用对象必须满足与关联容器中关键字一样的类型要求。

在实际编程中,重要的是,如果一个类型定义了“行为正常”的 < 运算符,则它可以用作关键字类型。

用来组织容器元素的操作的类型也是该容器类型的一部分。如果需要使用自定义的比较操作,则必须在定义关联容器类型时提供此操作的类型。操作类型在尖括号中紧跟着元素类型给出。

bool compareIsbn(const Sales_data &lhs, const Sales_data &rhs)
{
    return lhs.isbn() < rhs.isbn();
}

// bookstore中多条记录可以有相同的ISBN
// bookstore中的元素以ISBN的顺序进行排列
multiset<Sales_data, decltype(compareIsbn)*> bookstore(compareIsbn);
3)pair类型

pair 定义在头文件 utility 中。一个 pair 可以保存两个数据成员,分别命名为 firstsecond

pair<string, string> anon;        // 保存两个string
pair<string, size_t> word_count;  // 保存一个string和一个size_t
pair<string, vector<int>> line;   // 保存string和vector<int>

pair 的默认构造函数对数据成员进行值初始化。

pair 支持的操作:
在这里插入图片描述
在C++11中,如果函数需要返回 pair,可以对返回值进行列表初始化。早期C++版本中必须显式构造返回值。

pair<string, int> process(vector<string> &v)
{
    // 处理v
    if (!v.empty())
        // 列表初始化
        return { v.back(), v.back().size() };
    else
        // 隐式构造返回值
        return pair<string, int>();
}

3、关联容器操作

关联容器定义了类型别名来表示容器关键字和值的类型:
在这里插入图片描述
对于 set 类型,key_typevalue_type 是一样的。set 中保存的值就是关键字。对于 map 类型,元素是关键字-值对。即每个元素是一个 pair 对象,包含一个关键字和一个关联的值。由于元素关键字不能改变,因此 pair 的关键字部分是const的。

另外,只有 map 类型(unordered_mapunordered_multimapmultimapmap)才定义了 mapped_type

set<string>::value_type v1;        // v1是一个string
set<string>::key_type v2;          // v2是一个string
map<string, int>::value_type v3;   // v3是一个pair<const string, int>
map<string, int>::key_type v4;     // v4是一个string
map<string, int>::mapped_type v5;  // v5是一个int
1)关联容器迭代器

解引用关联容器迭代器时,会得到一个类型为容器的 value_type 的引用。对 map 而言,value_typepair 类型,其 first 成员保存 const 的关键字,second 成员保存值。

// 获得指向word_count中一个元素的迭代器
auto map_it = word_count.begin();
// *map_it是指向一个pair<const string, size_t>对象的引用
cout << map_it->first;          // 打印此元素的关键字
cout << " " << map_it->second;  // 打印此元素的值
map_it->first = "new key";      // 错误:关键字是const的
++map_it->second;               // 正确·我们可以通过迭代器改变元素

虽然 set 同时定义了 iteratorconst_iterator 类型,但两种迭代器都只允许只读访问 set 中的元素。类似 mapset 中的关键字也是 const 的。

set<int> iset = {0,1,2,3,4,5,6,7,8,9};
set<int>::iterator set_it = iset.begin();
if (set_it != iset.end())
{
    *set_it = 42;       // 错误:set中的关键字是只读的
    cout << *set_it << endl;    // 正确:可以读关键字
}

mapset 都支持 beginend 操作。使用迭代器遍历 mapmultimapsetmultiset 时,迭代器按关键字升序遍历元素。

// 获得一个指向首元素的迭代器
auto map_it = word_count.cbegin();
// 比较当前迭代器和尾后迭代器
while (map_it != word_count.cend()) {
// 解引用迭代器,打印关键字-值对
	cout << map_it->first << " occurs "
		<< map_it->second << " times" << endl;
	++map_it; // 递均迭代器, 移动到下一个元素
}

本程序的输出是按字典序排列的。当使用一个选代器遍历一个 mapmultimapsetmultiset 时,迭代器按关键字升序遍历元素。

通常不对关联容器使用泛型算法。

2)添加元素

使用 insert 成员可以向关联容器中添加元素。向 mapset 中添加已存在的元素对容器没有影响。

通常情况下,对于想要添加到 map 中的数据,并没有现成的 pair 对象。可以直接在 insert 的参数列表中创建 pair

// 向word_count插入word的4种方法
word_count.insert({word, 1});
word_count.insert(make_pair(word, 1));
word_count.insert(pair<string, size_t>(word, 1));
word_count.insert(map<string, size_t>::value_type(word, 1));

关联容器的 insert 操作:
在这里插入图片描述
insertemplace 的返回值依赖于容器类型和参数:

  • 对于不包含重复关键字的容器,添加单一元素的 insertemplace 版本返回一个 pair,表示操作是否成功。pairfirst 成员是一个迭代器,指向具有给定关键字的元素;second 成员是一个 bool 值。如果关键字已在容器中,则 insert 直接返回,bool 值为 false。如果关键字不存在,元素会被添加至容器中,bool 值为 true
  • 对于允许包含重复关键字的容器,添加单一元素的 insertemplace 版本返回指向新元素的迭代器。
3)删除元素

关联容器的删除操作:
在这里插入图片描述
与顺序容器不同,关联容器提供了一个额外的 erase 操作。它接受一个 key_type 参数,删除所有匹配给定关键字的元素(如果存在),返回实际删除的元素数量。

对于不包含重复关键字的容器,erase 的返回值总是1或0。若返回值为0,则表示想要删除的元素并不在容器中。

4)map的下标操作

map 下标运算符接受一个关键字,获取与此关键字相关联的值。如果关键字不在容器中,下标运算符会向容器中添加该关键字,并值初始化关联值。

由于下标运算符可能向容器中添加元素,所以只能对非 constmap 使用下标操作。

map 进行下标操作时,返回的是 mapped_type 类型的对象;解引用 map 迭代器时,返回的是 value_type 类型的对象。

mapunordered_map 的下标操作:
在这里插入图片描述

vectorstring 不同,map 的下标运算符返回的类型与解引用 map 选代器得到的类型不同。

5)访问元素

关联容器的查找操作:
在这里插入图片描述
在这里插入图片描述
如果 multimapmultiset 中有多个元素具有相同关键字,则这些元素在容器中会相邻存储。

string search_item("Alain de Botton");      // author we'll look for
auto entries = authors.count(search_item);  // number of elements
auto iter = authors.find(search_item);      // first entry for this author
// loop through the number of entries there are for this author
while(entries)
{
    cout << iter->second << endl;   // print each title
    ++iter;      // advance to the next title
    --entries;   // keep track of how many we've printed
}

当我们遍历一个 multimapmultiset 时,保证可以得到序列中所有具有给定关键字的元素。

lower_boundupper_bound 操作都接受一个关键字,返回一个迭代器。如果关键字在容器中,lower_bound 返回的迭代器会指向第一个匹配给定关键字的元素,而 upper_bound 返回的迭代器则指向最后一个匹配元素之后的位置。如果关键字不在 multimap 中,则 lower_boundupper_bound 会返回相等的迭代器,指向一个不影响排序的关键字插入位置。因此用相同的关键字调用 lower_boundupper_bound 会得到一个迭代器范围,表示所有具有该关键字的元素范围。

lower_bound 返回的迭代器可能指向一个具有给定关键字的元素,但也可能不指向。如果关键字不在容器中,则 lower_bound 会返回关键字的第一个安全插入点一—不影响容器中元素顺序的插入位置。

// authors和search_item的定义,与前面的程序一样
// beg和end表示对应此作者的元素的范围
for (auto beg = authors.lower_bound(search_item),
        end = authors.upper_bound(search_item);
    beg != end; ++beg)
    cout << beg->second << endl;    // 打印每个题目

lower_boundupper_bound 有可能返回尾后迭代器。如果查找的元素具有容器中最大的关键字,则 upper_bound 返回尾后迭代器。如果关键字不存在,且大于容器中任何关键字,则 lower_bound 也返回尾后迭代器。

如果 lower_boundupper_bound 返回相同的迭代器,则给定关键字不在容器中。

equal_range 操作接受一个关键字,返回一个迭代器 pair。若关键字存在,则第一个迭代器指向第一个匹配关键字的元素,第二个迭代器指向最后一个匹配元素之后的位置。若关键字不存在,则两个迭代器都指向一个不影响排序的关键字插入位置。

// authors和search_item的定义,与前面的程序一样
// pos保存迭代器对,表示与关键字匹配的元素范围
for (auto pos = authors.equal_range(search_item);
        pos.first != pos.second; ++pos.first)
    cout << pos.first->second << endl;  // 打印每个题目

4、无序容器

新标准库定义了4个 无序关联容器(unordered associative container),这些容器使用 哈希函数(hash function) 和关键字类型的 == 运算符组织元素。

如果关键字类型固有就是无序的,或者性能测试发现问题可以用哈希技术解决,就可以使用无序容器。

无序容器和对应的有序容器通常可以相互替换。但是由于元素未按顺序存储,使用无序容器的程序输出一般会与有序容器的版本不同。

无序容器在存储上组织为一组桶,每个桶保存零或多个元素。无序容器使用一个哈希函数将元素映射到桶。为了访问一个元素,容器首先计算元素的哈希值,它指出应该搜索哪个桶。容器将具有一个特定哈希值的所有元素都保存在相同的桶中。因此无序容器的性能依赖于哈希函数的质量和桶的数量及大小。

无序容器管理操作:
在这里插入图片描述
默认情况下,无序容器使用关键字类型的==运算符比较元素,还使用一个 hash<key_type> 类型的对象来生成每个元素的哈希值。标准库为内置类型和一些标准库类型提供了hash模板。因此可以直接定义关键字是这些类型的无序容器,而不能直接定义关键字类型为自定义类类型的无序容器,必须先提供对应的hash模板版本。

如果想要更多的资源,欢迎关注 @我是管小亮,文字强迫症MAX~

回复【福利】即可获取我为你准备的大礼,包括C++,编程四大件,NLP,深度学习等等的资料。

想看更多文(段)章(子),欢迎关注微信公众号「程序员管小亮」~

在这里插入图片描述

参考文章

  • 《C++ Primer》
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是管小亮

一口吃掉你的打赏,嗝~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值