C++的unordered_map使用

一、原理介绍

 unordered_map内部实现了一个哈希表(也叫散列表),通过把关键码值映射到Hash表中一个位置来访问记录。但其元素的排列顺序是无序的。哈希表最大的优点,就是把数据的存储和查找消耗的时间大大降低,查找的时间复杂度可达到O(1),其在海量数据处理中有着广泛应用;而代价仅仅是消耗比较多的内存。然而在当前可利用内存越来越多的情况下,用空间换时间的做法是值得的。另外,编码比较容易也是它的特点之一。

其基本原理是:使用一个下标范围比较大的数组来存储元素。可以设计一个函数(哈希函数,也叫做散列函数),使得每个元素的关键字都与一个函数值(即数组下标,hash值)相对应,于是用这个数组单元来存储这个元素;也可以简单的理解为,按照关键字为每一个元素“分类”,然后将这个元素存储在相应“类”所对应的地方,称为桶。

但是,不能够保证每个元素的关键字与函数值是一一对应的,因此极有可能出现对于不同的元素,却计算出了相同的函数值,这样就产生了“冲突”,换句话说,就是把不同的元素分在了相同的“类”之中。 总的来说,“直接定址”与“解决冲突”是哈希表的两大特点。

hash_map,首先分配一大片内存,形成许多桶。是利用hash函数,对key进行映射到不同区域(桶)进行保存。其插入过程是:

  1. 得到key
  2. 通过hash函数得到hash值
  3. 得到桶号(一般都为hash值对桶数求模)
  4. 存放key和value在桶内。

其取值过程是:

  1. 得到key
  2. 通过hash函数得到hash值
  3. 得到桶号(一般都为hash值对桶数求模)
  4. 比较桶的内部元素是否与key相等,若都不相等,则没有找到。
  5. 取出相等的记录的value。

hash_map中直接地址用hash函数生成,解决冲突,用比较函数解决。这里可以看出,如果每个桶内部只有一个元素,那么查找的时候只有一次比较。当许多桶内没有值时,许多查询就会更快了(指查不到的时候). 由此可见,要实现哈希表, 和用户相关的是:hash函数和比较函数。这两个参数刚好是我们在使用hash_map时需要指定的参数。

二、自定义hash函数

哈希函数(hash function)的目的是根据给定对象算出一个哈希码(hash code),使得对象经过hash code映射之后能够乱且随机地被放置在哈希表(hashtable)中,从而尽量避免发生哈希碰撞。

举个例子

#include <map>
#include <unordered_map>
#include <unordered_set>
#include <iostream>

using std::cout;
using std::endl;


class MyClass 
{
public:
    MyClass():str("hello"), data(0) {}

    bool operator==(const MyClass& rhs) const{return (data == rhs.data) && (str == rhs.str); }  //注意要重载这个==,
                                                                                                //因为unordered_set或者unordered_map
                                                                                                //中需要对元素是否相同进行判断

public: //
    int data;
    std::string str;
};

//注意这里是将自己写的偏特化也同样加入到std中,因为他的模板是在std里面的,
//具体形式可以自己简单查看一下源码中的实现形式
//然后照着写一个自己的版本就行了。
namespace std	
{
    template<>
    struct hash<MyClass>: public __hash_base<size_t, MyClass>   //标准库中有这个继承,查看一下其实只是继承两个typedef而已,
                                                                //所以不写这个继承在这个例子中也是可以运行的
                                                                //但为了更好的使用这个hash,写上去会比较好
    {
        size_t operator()(const MyClass& rhs) const noexcept    //这个const noexpect一定要写上去
        {
            return (std::hash<int>()(rhs.data)) ^ (std::hash<std::string>()(rhs.str) << 1); //当然,可以使用其他的方式来组合这个哈希值,
                                                                                            //这里是cppreference里面的例子,产生的数够乱就行。
        }
    };
}


int main()
{
    MyClass c;
    std::hash<MyClass> myHash;  //创建一个函数对象
    std::cout << myHash(c) << std::endl;

	//注意这第三个参数是typename _Hash = hash < _Value >, 是可写可不写的,因为他是有默认形式的,写出来就是这样
    std::unordered_map<MyClass, char, std::hash<MyClass>> m;	//这第三个参数

    std::unordered_set<MyClass> s;	//和上面的是一个意思,第二个参数是typename _Hash = hash < _Value >,可写可不写, 这里我是没写的。
    s.insert(c);
    s.insert(c);

    std::cin.get();
}

 

三、hash的实例

问题:求两数之和

利用unordered_map数组构造映射,遍历nums[i]时,看target-nums[i]是否存在hash表中即可。
时间复杂度O(n),空间复杂度O(n) 

class Solution4 {
public:
	vector<int> twoSum(vector<int>& nums, int target) {
		vector<int> ans;
		unordered_map<int, int>hashmap;
		for (int i = 0; i < nums.size(); i++) {
			if (hashmap[target - nums[i]]
				&& hashmap[target - nums[i]] != i + 1) {
				//防止利用同个元素
				ans.push_back(i);
				ans.push_back(hashmap[target - nums[i]] - 1);
				return ans;
			}
			hashmap[nums[i]] = i + 1;//将hash表对应下标+1,防止处理下标为0的情况
			
		}

		return ans;
	}
};

参考:

C++ STL中哈希表 hash_map从头到尾详细介绍_yousss的博客-CSDN博客_std::hash_map

关于HashMap几个刁钻的面试题_砖家穴者叫兽的博客-CSDN博客_关于hashmap的几道面试题 

常见的六种哈希构造函数_快点懂java的博客-CSDN博客_哈希表的常见函数有哪些

c++中std::hash的以及万能hash使用方法_米安r的博客-CSDN博客_std::hash

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值