HashMap简介
百度百科简介:
散列表(Hash table,也叫哈希表),是根据关键码值(Key
value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash)
函数。
英文文档简介:
A hash table (hash map) is a data structure that implements an
associative array abstract data type, a structure that can map keys to
values. A hash table uses a hash function to compute an index, also
called a hash code, into an array of buckets or slots, from which the
desired value can be found.
总结
哈希表是一种数据结构,但我们想要查找某一个值的时候,哈希表通过将关键值 key 做某种映射 f f f 到一张表的某个位置 f ( k e y ) f(key) f(key) 也叫 value,而表中这个位置的值就是我们要找的结果 也叫 buckets,而这张表就是一个 HashMap。
图片解释
先从简单入手,下图为 hashfunction 也就是
f
(
k
e
y
)
=
k
e
y
−
1001
f(key)=key-1001
f(key)=key−1001 的一种简单的映射,
k
e
y
key
key 为学生学号,
f
(
k
e
y
)
f(key)
f(key) 为位置的值,也就是我们经常使用的数组下标,
b
u
c
k
e
t
s
buckets
buckets 就是我们要找的值这里是学生姓名。
由此图可以看出当哈希函数为 f ( k e y ) = k e y − 1001 f(key) = key-1001 f(key)=key−1001 时任意给出一个学号只需做一次运算即可得出学生的姓名,虽然增大了空间开销但是搜索速度达到了 O ( 1 ) O(1) O(1)。
当然真正的哈希函数并不一定是这样的,要根据具体问题具体分析,如果学号不是连续的那么哈希函数取
f
(
k
e
y
)
=
k
e
y
−
1001
f(key)=key-1001
f(key)=key−1001可能会造成很多空间的浪费如下图:
在Java的HashMap中使用的是按位逻辑与来计算哈希值的,具体如下:
Value = hashCode( k e y key key ) & (HashMap.initialCapacity - 1)
initialCapacity 是初始化哈希表长度,究其本质就是一个对表长取模也就是取余的运算,只是相比于整数运算二进制运算的效率要高很多,笔者没研究过源码就不过多赘述。我们也可以利用重写Object中的hashCode()方法来编写我们自己的哈希函数。
至于为什么是Object类中的hashCode()方法而不是HashMap类下的,笔者才疏学浅只能参考官网文档,见官方文档:
链接:hashCode()
HashMap的使用
从一道题出发
给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。
你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。
示例:
给定 nums = [2, 7, 11, 15], target = 9
因为 nums[0] + nums[1] = 2 + 7 = 9
所以返回 [0, 1]
简单的一种解法
直接利用数组两层循环查找到我们想要的结果:
class Solution {
public int[] twoSum(int[] nums, int target) {
// 直接两层for循环搜索
for (int i = 0; i < nums.length; i++) {
for (int j = i + 1; j < nums.length; j++) {
if (nums[j] == target - nums[i]) {
// 返回数组下标
return new int[] { i, j };
}
}
}
// 如果循环结束没有找到则抛出异常
throw new IllegalArgumentException("No two sum solution");
}
}
利用哈希表方法找到我们想要的结果
首先介绍一下需要用到的方法
K - the type of keys maintained by this map
V - the type of mapped values
详解请参阅 HashMap
- put() 方法: public V put(K key, V value) 放一个元素
- get() 方法:public V get(Object key) 取一个元素如过没有返回null
- containsKey() 方法:public boolean containsKey(Object key) 检查元素
class Solution {
public int[] twoSum(int[] nums, int target) {
// 利用哈希表的方法查找
Map<Integer, Integer> map = new HashMap<>();
map.put(nums[0], 0);
for (int i = 1; i < nums.length; i++) {
int complement = target - nums[i];
if (map.containsKey(complement)) {
// 返回数组下标
return new int[] { map.get(complement), i };
}
map.put(nums[i], i);
}
//如过没有找到则抛出异常信息
throw new IllegalArgumentException("No two sum solution");
}
}
看不懂的我可以解释一下:首先整个算法是往哈希表里放进去一个数就找一次,这样所有数放完也就一定找完了。
然后我为什么要把一个map.put() 放在循环外面,其实可以放在里面,然后循环从0开始,但是我比较抠,放在外面map.containsKey()就少做了一次,有点强迫症吧。
还有就是为什么map.put() 方法为什么不放在循环的开始,题中说明不能返回一样的数组下标,如过放在开始containsKey()可能会找两个一样的数返回。
最后可能有对Integer困惑的同学可以看看Java的泛型介绍以及Integer和int的区别就明白了,这里我就不再赘述。
冲突问题
如过两个
k
e
y
key
key 经过哈希函数转换以后得到了相同值的 ?答案是非常有可能的,无论哈希函数设计有多么精细,都会产生冲突的可能,这时候该怎么办呢?我们可以利用链表来解决。
HashMap数组的每一个元素不止是一个 bucket 对象,也是一个链表的头节点。每一个 bucket 对象通过 next 指针指向它的下一个 bucket 节点。当新来的 bucket 映射到冲突的数组位置时,只需要插入到对应的链表即可:
需要注意的是,新来的 bucket 节点插入链表时在Java中使用的是“头插法”。
题目来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/two-sum