C++中的set、unordered_set、map、unordered_map详解以及如何选择

最新推荐文章于 2024-05-26 23:54:48 发布

我是纠结伦

最新推荐文章于 2024-05-26 23:54:48 发布

阅读量2.6k

点赞数 5

分类专栏： c++ 文章标签：蓝桥杯 c++ c语言开发语言算法

本文链接：https://blog.csdn.net/weixin_52244492/article/details/124628733

版权

c++ 专栏收录该内容

79 篇文章 8 订阅

订阅专栏

set：

set就是关键字的简单集合。当只是想知道一个值是否存在时，set是最有用的。

一、set的模板参数介绍

template < class T,                        // 表示set里面存放的数据类型
           class Compare = less<T>,        // 仿函数，可以指定让set按照什么方式进行比较数据
           class Alloc = allocator<T>     // 空间配置器，默认是系统提供的
         >

(1)第二个模板参数Compare为仿函数，表示按照何种方式进行数据的比较，因为set进行遍历是有序的，当前仿函数的比较方式让set遍历的序列是递增的序列；如果想要让set遍历的序列为递减序列，就可以将第二个模板参数改为greater；另一方面如果set里面存放的是自定义类型，则必须自己实现一个仿函数用于支持两个自定义类型大小的比较。
(2)第三个模板参数Alloc为空间配置器。

二、set特点

在set中每个元素的值都唯一，而且系统能根据元素的值自动进行排序。set中元素的值不能直接被改变。set内部采用的是一种非常高效的平衡检索二叉树：红黑树，也称为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树。

set具备的两个特点：

set中的元素都是排序好的
set中的元素都是唯一的，没有重复的

三、set操作

begin();            // 返回指向第一个元素的迭代器
end();              // 返回指向迭代器的最末尾处（即最后一个元素的下一个位置）
clear();            // 清除所有元素
count();            // 返回某个值元素的个数
 
empty();            // 如果集合为空，返回true
 
equal_range();      //返回集合中与给定值相等的上下限的两个迭代器
 
erase()–删除集合中的元素
 
find()–返回一个指向被查找到元素的迭代器
 
get_allocator()–返回集合的分配器
 
insert()–在集合中插入元素
 
lower_bound()–返回指向大于（或等于）某值的第一个元素的迭代器
 
key_comp()–返回一个用于元素间值比较的函数
 
max_size()–返回集合能容纳的元素的最大限值
 
rbegin()–返回指向集合中最后一个元素的反向迭代器
 
rend()–返回指向集合中第一个元素的反向迭代器
 
size()–集合中元素的数目
 
swap()–交换两个集合变量
 
upper_bound()–返回大于某个值元素的迭代器
 
value_comp()–返回一个用于比较元素间的值的函数

begin() and end()

// set::begin/end
#include <iostream>
#include <set>
 
int main ()
{
  int myints[] = {75,23,65,42,13};
  std::set<int> myset (myints, myints+5);
 
  std::cout << "myset contains:";
  for (std::set<int>::iterator it=myset.begin(); it!=myset.end(); ++it)
    std::cout << ' ' << *it;
 
  std::cout << '\n';
 
  return 0;
}
 
Output:
myset contains: 13 23 42 65 75

unordered_set：

std::unordered_set<key>是一种STL提供的无序集合的类，集合的特点就是其中没有任何重复的元素，这个特点非常适合用于纪录某个数据中是否有重复的数据，并且将其挑出来。std::unordered_set其和std::set不同的一点是，前者是没有顺序的，而后者会对元素顺序进行排序，也正是因为其没有顺序，无序set的速度要快得多。通常可以在常数时间进行插入和删除。无序set的键值和其内容值是一样的，和map不同的，我们不能修改其内容，但是可以插入元素或者删除元素。
其类声明原型为：

template < class Key,                        // unordered_set::key_type/value_type
           class Hash = hash<Key>,           // unordered_set::hasher
           class Pred = equal_to<Key>,       // unordered_set::key_equal
           class Alloc = allocator<Key>      // unordered_set::allocator_type
           > class unordered_set;

其中最需要注意的其实就是key的数据类型的指定了。其常用的函数也不多：

find() 查找元素
insert() 插入元素
erase() 删除元素
clear() 清空容器
empty() 判断容器是否为空
size() 返回容器的大小

set总结：

std::unordered_set底层实现为哈希表，std::set 和std::multiset 的底层实现是红黑树，红黑树是一种平衡二叉搜索树，所以key值是有序的，但key不可以修改，改动key值会导致整棵树的错乱，所以只能删除和增加。

map：

map是STL的一个关联容器，它提供一对一的hash。

第一个可以称为关键字(key)，每个关键字只能在map中出现一次；
第二个可能称为该关键字的值(value)；

插入元素

// 定义一个map对象
map<int, string> mapStudent;
 
// 第一种 用insert函數插入pair
mapStudent.insert(pair<int, string>(000, "student_zero"));
 
// 第二种 用insert函数插入value_type数据
mapStudent.insert(map<int, string>::value_type(001, "student_one"));
 
// 第三种 用"array"方式插入
mapStudent[123] = "student_first";
mapStudent[456] = "student_second";

区别：

当然了第一种和第二种在效果上是完成一样的，用insert函数插入数据，在数据的插入上涉及到集合的唯一性这个概念，即当map中有这个关键字时，insert操作是不能在插入数据的，但是用数组方式就不同了，它可以覆盖以前该关键字对应的值。

查找元素：

// find 返回迭代器指向当前查找元素的位置否则返回map::end()位置
iter = mapStudent.find("123");
 
if(iter != mapStudent.end())
       cout<<"Find, the value is"<<iter->second<<endl;
else
   cout<<"Do not Find"<<endl;

刪除与清空元素：

//迭代器刪除
iter = mapStudent.find("123");
mapStudent.erase(iter);
 
//用关键字刪除
int n = mapStudent.erase("123"); //如果刪除了會返回1，否則返回0
 
//用迭代器范围刪除 : 把整个map清空
mapStudent.erase(mapStudent.begin(), mapStudent.end());
//等同于mapStudent.clear()

map的基本操作函数：

begin()         返回指向map头部的迭代器

     clear(）        删除所有元素

     count()         返回指定元素出现的次数, (帮助评论区理解： 因为key值不会重复，所以只能是1 or 0)

     empty()         如果map为空则返回true

     end()           返回指向map末尾的迭代器

     equal_range()   返回特殊条目的迭代器对

     erase()         删除一个元素

     find()          查找一个元素

     get_allocator() 返回map的配置器

     insert()        插入元素

     key_comp()      返回比较元素key的函数

     lower_bound()   返回键值>=给定元素的第一个位置

     max_size()      返回可以容纳的最大元素个数

     rbegin()        返回一个指向map尾部的逆向迭代器

     rend()          返回一个指向map头部的逆向迭代器

     size()          返回map中元素的个数

     swap()           交换两个map

     upper_bound()    返回键值>给定元素的第一个位置

     value_comp()     返回比较元素value的函数

unordered_map:

unordered_map是一个将key和value关联起来的容器，它可以高效的根据单个key值查找对应的value。
key值应该是唯一的，key和value的数据类型可以不相同。
unordered_map存储元素时是没有顺序的，只是根据key的哈希值，将元素存在指定位置，所以根据key查找单个value时非常高效，平均可以在常数时间内完成。
unordered_map查询单个key的时候效率比map高，但是要查询某一范围内的key值时比map效率低。
可以使用[]操作符来访问key值对应的value值。

unordered_map: unordered_map内部实现了一个哈希表，因此其元素的排列顺序是杂乱的，无序的

std::unordered_map<std::string, std::int> umap; //定义

umap.insert(Map::value_type("test", 1));//增加

//根据key删除,如果没找到n=0
auto n = umap.erase("test")   //删除

auto it = umap.find(key) //改
if(it != umap.end()) 
    it->second = new_value; 


//map中查找x是否存在
umap.find(x) != map.end()//查
//或者
umap.count(x) != 0

map总结：

std::unordered_map 底层实现为哈希表，std::map 和std::multimap 的底层实现是红黑树。同理，std::map 和std::multimap 的key也是有序的（这个问题也经常作为面试题，考察对语言容器底层的理解）。

关于以上容器的选择：

当我们要使用集合来解决哈希问题的时候，优先使用unordered_set，因为它的查询和增删效率是最优的，如果需要集合是有序的，那么就用set，如果要求不仅有序还要有重复数据的话，那么就用multiset。

那么再来看一下map ，在map 是一个key value 的数据结构，map中，对key是有限制，对value没有限制的，因为key的存储方式使用红黑树实现的。

其他语言例如：java里的HashMap ，TreeMap 都是一样的原理。可以灵活贯通。

虽然std::set、std::multiset 的底层实现是红黑树，不是哈希表，但是std::set、std::multiset 依然使用哈希函数来做映射，只不过底层的符号表使用了红黑树来存储数据，所以使用这些数据结构来解决映射问题的方法，我们依然称之为哈希法。 map也是一样的道理。

我是纠结伦

关注

5
点赞
踩
25

收藏

觉得还不错? 一键收藏
打赏
0
评论
C++中的set、unordered_set、map、unordered_map详解以及如何选择

set：set就是关键字的简单集合。当只是想知道一个值是否存在时，set是最有用的。一、set的模板参数介绍template < class T, // 表示set里面存放的数据类型 class Compare = less<T>, // 仿函数，可以指定让set按照什么方式进行比较数据 class Alloc = allocator<T> // 空间配
复制链接

扫一扫