HashMap简介和使用

最新推荐文章于 2021-06-23 23:09:37 发布

水墨o青衫

最新推荐文章于 2021-06-23 23:09:37 发布

阅读量250

点赞数

分类专栏：博客文章标签： HashMap基础

本文链接：https://blog.csdn.net/humhaw/article/details/103197403

版权

博客专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HashMap简介

百度百科简介：

散列表（Hash table，也叫哈希表），是根据关键码值(Key
value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。
给定表M，存在函数f(key)，对任意给定的关键字值key，代入函数后若能得到包含该关键字的记录在表中的地址，则称表M为哈希(Hash）表，函数f(key)为哈希(Hash)
函数。

英文文档简介：

A hash table (hash map) is a data structure that implements an
associative array abstract data type, a structure that can map keys to
values. A hash table uses a hash function to compute an index, also
called a hash code, into an array of buckets or slots, from which the
desired value can be found.

总结

哈希表是一种数据结构，但我们想要查找某一个值的时候，哈希表通过将关键值 key 做某种映射 $f$ 到一张表的某个位置 $f (k e y)$ 也叫 value，而表中这个位置的值就是我们要找的结果也叫 buckets，而这张表就是一个 HashMap。

图片解释

先从简单入手，下图为 hashfunction 也就是 $f (k e y) = k e y - 1001$ 的一种简单的映射， $k e y$ 为学生学号， $f (k e y)$ 为位置的值，也就是我们经常使用的数组下标， $b u c k e t s$ 就是我们要找的值这里是学生姓名。
在这里插入图片描述

由此图可以看出当哈希函数为 $f (k e y) = k e y - 1001$ 时任意给出一个学号只需做一次运算即可得出学生的姓名，虽然增大了空间开销但是搜索速度达到了 $O (1)$ 。

当然真正的哈希函数并不一定是这样的，要根据具体问题具体分析，如果学号不是连续的那么哈希函数取 $f (k e y) = k e y - 1001$ 可能会造成很多空间的浪费如下图：
在这里插入图片描述
在Java的HashMap中使用的是按位逻辑与来计算哈希值的，具体如下：

Value = hashCode( $k e y$ ) & (HashMap.initialCapacity - 1)

initialCapacity 是初始化哈希表长度，究其本质就是一个对表长取模也就是取余的运算，只是相比于整数运算二进制运算的效率要高很多，笔者没研究过源码就不过多赘述。我们也可以利用重写Object中的hashCode()方法来编写我们自己的哈希函数。
至于为什么是Object类中的hashCode()方法而不是HashMap类下的，笔者才疏学浅只能参考官网文档，见官方文档：
在这里插入图片描述
链接：hashCode()

HashMap的使用

从一道题出发

给定一个整数数组 nums 和一个目标值 target，请你在该数组中找出和为目标值的那两个整数，并返回他们的数组下标。

你可以假设每种输入只会对应一个答案。但是，你不能重复利用这个数组中同样的元素。

示例:

给定 nums = [2, 7, 11, 15], target = 9
因为 nums[0] + nums[1] = 2 + 7 = 9
所以返回 [0, 1]

简单的一种解法

直接利用数组两层循环查找到我们想要的结果：

class Solution {
    public int[] twoSum(int[] nums, int target) {
        // 直接两层for循环搜索
        for (int i = 0; i < nums.length; i++) {
            for (int j = i + 1; j < nums.length; j++) {
                if (nums[j] == target - nums[i]) {
                	// 返回数组下标
                    return new int[] { i, j };
                }
            }
        }
   
        // 如果循环结束没有找到则抛出异常
        throw new IllegalArgumentException("No two sum solution");
    }
}

利用哈希表方法找到我们想要的结果

首先介绍一下需要用到的方法
K - the type of keys maintained by this map
V - the type of mapped values
详解请参阅 HashMap

put() 方法: public V put(K key, V value) 放一个元素
get() 方法：public V get(Object key) 取一个元素如过没有返回null
containsKey() 方法：public boolean containsKey(Object key) 检查元素

class Solution {
    public int[] twoSum(int[] nums, int target) {
    	// 利用哈希表的方法查找
        Map<Integer, Integer> map = new HashMap<>();
        map.put(nums[0], 0);
        for (int i = 1; i < nums.length; i++) {
            int complement = target - nums[i];
            if (map.containsKey(complement)) {
            	// 返回数组下标
                return new int[] { map.get(complement), i };
            }
            map.put(nums[i], i);
        }

		//如过没有找到则抛出异常信息
        throw new IllegalArgumentException("No two sum solution");
    }
}

看不懂的我可以解释一下：首先整个算法是往哈希表里放进去一个数就找一次，这样所有数放完也就一定找完了。

然后我为什么要把一个map.put() 放在循环外面，其实可以放在里面，然后循环从0开始，但是我比较抠，放在外面map.containsKey()就少做了一次，有点强迫症吧。

还有就是为什么map.put() 方法为什么不放在循环的开始，题中说明不能返回一样的数组下标，如过放在开始containsKey()可能会找两个一样的数返回。

最后可能有对Integer困惑的同学可以看看Java的泛型介绍以及Integer和int的区别就明白了，这里我就不再赘述。

冲突问题

如过两个 $k e y$ 经过哈希函数转换以后得到了相同值的？答案是非常有可能的，无论哈希函数设计有多么精细，都会产生冲突的可能，这时候该怎么办呢？我们可以利用链表来解决。
HashMap数组的每一个元素不止是一个 bucket 对象，也是一个链表的头节点。每一个 bucket 对象通过 next 指针指向它的下一个 bucket 节点。当新来的 bucket 映射到冲突的数组位置时，只需要插入到对应的链表即可：
需要注意的是，新来的 bucket 节点插入链表时在Java中使用的是“头插法”。