C++的unordered_map使用

物随心转

已于 2022-11-09 22:24:07 修改

阅读量1.9k

点赞数

分类专栏： C++ 文章标签： c++ 数据结构散列表

于 2020-07-08 22:36:06 首次发布

本文链接：https://blog.csdn.net/sinat_31608641/article/details/107216535

版权

C++ 专栏收录该内容

167 篇文章 28 订阅

订阅专栏

一、原理介绍

unordered_map内部实现了一个哈希表（也叫散列表），通过把关键码值映射到Hash表中一个位置来访问记录。但其元素的排列顺序是无序的。哈希表最大的优点，就是把数据的存储和查找消耗的时间大大降低，查找的时间复杂度可达到O(1)，其在海量数据处理中有着广泛应用；而代价仅仅是消耗比较多的内存。然而在当前可利用内存越来越多的情况下，用空间换时间的做法是值得的。另外，编码比较容易也是它的特点之一。

其基本原理是：使用一个下标范围比较大的数组来存储元素。可以设计一个函数（哈希函数，也叫做散列函数），使得每个元素的关键字都与一个函数值（即数组下标，hash值）相对应，于是用这个数组单元来存储这个元素；也可以简单的理解为，按照关键字为每一个元素“分类”，然后将这个元素存储在相应“类”所对应的地方，称为桶。

但是，不能够保证每个元素的关键字与函数值是一一对应的，因此极有可能出现对于不同的元素，却计算出了相同的函数值，这样就产生了“冲突”，换句话说，就是把不同的元素分在了相同的“类”之中。总的来说，“直接定址”与“解决冲突”是哈希表的两大特点。

hash_map，首先分配一大片内存，形成许多桶。是利用hash函数，对key进行映射到不同区域（桶）进行保存。其插入过程是：

得到key
通过hash函数得到hash值
得到桶号(一般都为hash值对桶数求模)
存放key和value在桶内。

其取值过程是:

得到key
通过hash函数得到hash值
得到桶号(一般都为hash值对桶数求模)
比较桶的内部元素是否与key相等，若都不相等，则没有找到。
取出相等的记录的value。

hash_map中直接地址用hash函数生成，解决冲突，用比较函数解决。这里可以看出，如果每个桶内部只有一个元素，那么查找的时候只有一次比较。当许多桶内没有值时，许多查询就会更快了(指查不到的时候). 由此可见，要实现哈希表, 和用户相关的是：hash函数和比较函数。这两个参数刚好是我们在使用hash_map时需要指定的参数。

二、自定义hash函数

哈希函数（hash function）的目的是根据给定对象算出一个哈希码（hash code），使得对象经过hash code映射之后能够乱且随机地被放置在哈希表（hashtable）中，从而尽量避免发生哈希碰撞。

举个例子

#include <map>
#include <unordered_map>
#include <unordered_set>
#include <iostream>

using std::cout;
using std::endl;


class MyClass 
{
public:
    MyClass():str("hello"), data(0) {}

    bool operator==(const MyClass& rhs) const{return (data == rhs.data) && (str == rhs.str); }  //注意要重载这个==，
                                                                                                //因为unordered_set或者unordered_map
                                                                                                //中需要对元素是否相同进行判断

public: //
    int data;
    std::string str;
};

//注意这里是将自己写的偏特化也同样加入到std中，因为他的模板是在std里面的，
//具体形式可以自己简单查看一下源码中的实现形式
//然后照着写一个自己的版本就行了。
namespace std	
{
    template<>
    struct hash<MyClass>: public __hash_base<size_t, MyClass>   //标准库中有这个继承，查看一下其实只是继承两个typedef而已，
                                                                //所以不写这个继承在这个例子中也是可以运行的
                                                                //但为了更好的使用这个hash，写上去会比较好
    {
        size_t operator()(const MyClass& rhs) const noexcept    //这个const noexpect一定要写上去
        {
            return (std::hash<int>()(rhs.data)) ^ (std::hash<std::string>()(rhs.str) << 1); //当然，可以使用其他的方式来组合这个哈希值,
                                                                                            //这里是cppreference里面的例子，产生的数够乱就行。
        }
    };
}


int main()
{
    MyClass c;
    std::hash<MyClass> myHash;  //创建一个函数对象
    std::cout << myHash(c) << std::endl;

	//注意这第三个参数是typename _Hash = hash < _Value >， 是可写可不写的，因为他是有默认形式的，写出来就是这样
    std::unordered_map<MyClass, char, std::hash<MyClass>> m;	//这第三个参数

    std::unordered_set<MyClass> s;	//和上面的是一个意思，第二个参数是typename _Hash = hash < _Value >，可写可不写， 这里我是没写的。
    s.insert(c);
    s.insert(c);

    std::cin.get();
}

三、hash的实例

问题：求两数之和

利用unordered_map数组构造映射，遍历nums[i]时，看target-nums[i]是否存在hash表中即可。
时间复杂度O（n），空间复杂度O（n）

class Solution4 {
public:
	vector<int> twoSum(vector<int>& nums, int target) {
		vector<int> ans;
		unordered_map<int, int>hashmap;
		for (int i = 0; i < nums.size(); i++) {
			if (hashmap[target - nums[i]]
				&& hashmap[target - nums[i]] != i + 1) {
				//防止利用同个元素
				ans.push_back(i);
				ans.push_back(hashmap[target - nums[i]] - 1);
				return ans;
			}
			hashmap[nums[i]] = i + 1;//将hash表对应下标＋1，防止处理下标为0的情况
			
		}

		return ans;
	}
};

参考：

C++ STL中哈希表 hash_map从头到尾详细介绍_yousss的博客-CSDN博客_std::hash_map

关于HashMap几个刁钻的面试题_砖家穴者叫兽的博客-CSDN博客_关于hashmap的几道面试题

常见的六种哈希构造函数_快点懂java的博客-CSDN博客_哈希表的常见函数有哪些

c++中std::hash的以及万能hash使用方法_米安r的博客-CSDN博客_std::hash

物随心转

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
C++的unordered_map使用

一、原理介绍unordered_map: unordered_map内部实现了一个哈希表（也叫散列表），通过把关键码值映射到Hash表中一个位置来访问记录。但其元素的排列顺序是无序的。哈希表最大的优点，就是把数据的存储和查找消耗的时间大大降低，查找的时间复杂度可达到O(1)，其在海量数据处理中有着广泛应用；而代价仅仅是消耗比较多的内存。然而在当前可利用内存越来越多的情况下，用空间换时间的做法是值得的。另外，编码比较容易也是它的特点之一。其基本原理是：使用一个下标范围比较大的数组来存储元素。可以设计一
复制链接

扫一扫