HashMap中对hash值的计算

论菜南波旺

已于 2024-08-16 16:11:31 修改

阅读量314

点赞数 11

分类专栏： Java 文章标签：哈希算法算法散列表

于 2024-08-16 16:09:08 首次发布

本文链接：https://blog.csdn.net/qq_57865884/article/details/141261548

版权

Java 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、hash值的稳定性
- - - - 举个例子
二、HashMap中的hash值
- - - hash函数
    - - 具体步骤
      - 举个例子
总结

前言

1.同一个对象，在hashMap与TreeMap的哈希值是一样吗？如何保证hash值的稳定性？
2.HashMap的链表长度超过8的时候，会将链表转换成红黑树。但是hashCode分布良好的话，链表的长度符合泊松分布，长度达到8的概率小于千万分之一。hashCode是如何保持分布良好的？

一、hash值的稳定性

  public int hashCode() {
        int h = 0;
        Iterator<Entry<K,V>> i = entrySet().iterator();
        while (i.hasNext())
            h += i.next().hashCode();
        return h;
    }

这段代码通过遍历entrySet()集合的hash值确保了两个包含相同键值对的Map对象生成相同的哈希值，从而保证了哈希值的稳定性。什么是稳定性呢?

稳定性是指，即使键值对的顺序不同，只要两个Map对象包含相同的键值对（键和值都相同），它们的hashCode()返回的值也会相同。
这确保了对于相同内容的Map对象，生成的哈希值具有一致性和稳定性。

举个例子

假设有两个Map对象：

Map<String, Integer> map1 = new HashMap<>();
map1.put("apple", 10);
map1.put("banana", 20);

Map<String, Integer> map2 = new TreeMap<>();
map2.put("banana", 20);
map2.put("apple", 10);

map1是HashMap，map2是TreeMap。尽管这两个Map对象可能以不同的顺序存储这些键值对（HashMap可能按照哈希码分布存储，而TreeMap按照键的字典顺序存储），它们的内容（即键和值的配对）是相同的。
根据前面代码中的hashCode()方法，这两个Map对象的hashCode()值将会是相同的，因为它们包含的键值对是相同的，并且哈希值累加过程对顺序无关。

二、HashMap中的hash值

hash函数

代码如下（示例）：

static final int hash(Object key) {
  int h;
  return(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

具体步骤

检查key是否为null

(key == null) ? 0

如果key是null，这个方法直接返回哈希值0。在许多哈希表实现中，null键通常是允许的，并且会映射到哈希值为0的位置。

计算键的原始哈希值

h = key.hashCode()

这一步通过调用key对象的hashCode()方法，计算出它的原始哈希值，并将其存储在变量h中。

扰动哈希值以减少冲突

(h = key.hashCode()) ^ (h >>> 16)

首先计算出h的原始哈希值，然后将这个哈希值与它自身的高16位进行异或运算（^是位运算符，用于执行按位异或操作）。
h >>> 16是一个无符号右移操作，将h向右移16位，结果是原始哈希值的高16位被移到低16位的位置，而高位用0填充。
通过h与h >>> 16进行异或操作，原始哈希值的高16位和低16位的信息被混合在一起。

举个例子

假设key.hashCode()的值为0x12345678：
高16位是0x1234，低16位是0x5678。
h >>> 16将高16位移到低16位，结果是0x00001234。
现在，将原始哈希值0x12345678与0x00001234进行异或操作：

   0x12345678
^  0x00001234 得到
   0x1234444C

得到的结果0x1234444C是扰动后的哈希值，它保留了原始哈希值的信息，但也混合了高低位的数据，从而可以更均匀地分布到哈希表中。

总结

hash函数的优点：
使用位运算代替传统的取模运算，加快计算效率
将hashCode的高位与地位进行搅动运算，进一步减少哈希冲突

论菜南波旺

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
HashMap中对hash值的计算

1.同一个对象，在hashMap与TreeMap的哈希值是一样吗？如何保证hash值的稳定性？2.HashMap的链表长度超过8的时候，会将链表转换成红黑树。但是hashCode分布良好的话，链表的长度符合泊松分布，长度达到8的概率小于千万分之一。hashCode是如何保持分布良好的？使用位运算代替传统的取模运算，加快计算效率将hashCode的高位与地位进行搅动运算，进一步减少哈希冲突。
复制链接

扫一扫