HashMap中解决哈希冲突

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


一、什么是哈希冲突

当我们对某个元素进行哈希运算,得到一个存储地址,然后要进行插入的时候,发现已经被其他元素占用了,其实这就是所谓的哈希冲突,也叫哈希碰撞。
哈希函数的设计至关重要,好的哈希函数会尽可能地保证 计算简单和散列地址分布均匀,但是,我们需要清楚的是,数组是一块连续的固定长度的内存空间,再好的哈希函数也不能保证得到的存储地址绝对不发生冲突。

二、如何解决哈希冲突

哈希冲突的解决方案有多种:开放地址法(发生冲突,继续寻找下一块未被占用的存储地址),二次散列函数法,链地址法。

在HashMap中就用到了二次散列的方法:

final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {//这里针对String优化了Hash函数,是否使用新的Hash函数和Hash因子有关  
            return sun.misc.Hashing.stringHash32((String) k);
        }
		//二次散列,没有直接用hashCode的值,解决hash冲突
        h ^= k.hashCode();
        
		//扰动函数,增加值的不确定性
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

还有链地址法数组+链表的方式
什么是链地址法,简单来说,HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,其时间复杂度为O(n),首先遍历链表,存在即覆盖,否则新增;对于查找操作来讲,仍需遍历链表,然后通过key对象的equals方法逐一比对查找。所以,性能考虑,HashMap中的链表出现越少,性能才会越好。
HashMap做了一个Entry数组:

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;  // 键
    V value;  // 值
    Entry<K,V> next; // 指向下一个节点 ,也是一个Entry对象,从而形成解决hash冲突的单链表
    int hash;  // hash值
  
    /** 
     * 构造方法,创建一个Entry 
     * 参数:哈希值h,键值k,值v、下一个节点n 
     */  
    Entry(int h, K k, V v, Entry<K,V> n) {  
        value = v;  
        next = n;  
        key = k;  
        hash = h;  
    }  
  
    // 返回 与 此项 对应的键
    public final K getKey() {  
        return key;  
    }  

    // 返回 与 此项 对应的值
    public final V getValue() {  
        return value;  
    }  
  
    public final V setValue(V newValue) {  
        V oldValue = value;  
        value = newValue;  
        return oldValue;  
    }  
    
   /** 
     * equals()
     * 作用:判断2个Entry是否相等,必须key和value都相等,才返回true  
     */ 
      public final boolean equals(Object o) {  
        if (!(o instanceof Map.Entry))  
            return false;  
        Map.Entry e = (Map.Entry)o;  
        Object k1 = getKey();  
        Object k2 = e.getKey();  
        if (k1 == k2 || (k1 != null && k1.equals(k2))) {  
            Object v1 = getValue();  
            Object v2 = e.getValue();  
            if (v1 == v2 || (v1 != null && v1.equals(v2)))  
                return true;  
        }  
        return false;  
    } 

在put()方法中处理哈希冲突:

public V put(K key, V value) {
        //如果table数组为空数组{},进行数组填充(为table分配实际内存空间),
        //入参为threshold,此时threshold为initialCapacity 默认是1<<4(=16)
        if (table == EMPTY_TABLE) {
            inflateTable(threshold);//分配数组空间
        }
       	//对空值进行判断---允许空值null
        if (key == null)
            return putForNullKey(value);
        //获取哈希码
        int hash = hash(key);
        //得到对应数组下标位置
        int i = indexFor(hash, table.length);
        //如果放入的数组的位置上没有元素,那么直接添加,不用走这个for循环
        //e != null 满足的话就证明这个位置上有东西了
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            //发生哈希冲突的时候,会先比较哈希值
            //比较是否是同一个对象,equals就不比
            //如果不是同一个对象,会比较equals方法
            //如果哈希值一样,equals方法的结果也一样,那么才会走这个if方法
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            	//获取老的value
                V oldValue = e.value;
                //新value替换老value----只替换value 不替换key
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        //新增一个entry
        addEntry(hash, key, value, i);
        return null;
    }
在使用HashMap时,由于哈希表的大小是有限的,而键的数量是无限的,因此不同的键可能会映射到相同的哈希表索引上,这就是哈希冲突。当发生哈希冲突时,HashMap会在相应的哈希表索引处维护一个链表,将具有相同哈希值的键值对存储在链表。当需要查找某个键值对时,HashMap会先计算该键的哈希值,然后在相应的哈希表索引处的链表查找该键值对。 解决哈希冲突的方法有很多种,HashMap底层是通过链表来解决哈希冲突的。当发生哈希冲突时,新的键值对会被插入到相应哈希表索引处的链表的头部,这样可以保证在查找键值对时,能够先找到最新插入的键值对。但是,当链表过长时,会影响HashMap的性能,因此Java 8引入了红黑树来优化链表过长的情况。 下面是一个演示HashMap哈希冲突的例子: ```java import java.util.HashMap; public class HashMapDemo { public static void main(String[] args) { HashMap<String, Integer> map = new HashMap<>(); map.put("apple", 1); map.put("banana", 2); map.put("orange", 3); map.put("peach", 4); map.put("grape", 5); map.put("watermelon", 6); map.put("pineapple", 7); map.put("kiwi", 8); map.put("pear", 9); map.put("mango", 10); map.put("strawberry", 11); map.put("blueberry", 12); map.put("raspberry", 13); map.put("blackberry", 14); map.put("cherry", 15); map.put("pomegranate", 16); map.put("apricot", 17); map.put("plum", 18); map.put("fig", 19); map.put("date", 20); map.put("peach", 21); // 重复插入键"peach" System.out.println(map); } } ``` 输出结果为: ``` {orange=3, watermelon=6, grape=5, kiwi=8, pear=9, apple=1, peach=21, fig=19, blackberry=14, blueberry=12, raspberry=13, date=20, pineapple=7, strawberry=11, pomegranate=16, banana=2, plum=18, mango=10, cherry=15} ``` 可以看到,由于键"peach"被重复插入,导致原来的键值对被覆盖了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值