HashMap原理


HashMap是Java常用的用来储存键值对的数据结构,它是线程不安全的,可以储存null键值,这些大家经常用,也都知道,接下来根据源码分析一下HashMap的实现。

数组:采用一段连续的存储单元来存储数据。对于指定下标的查找,时间复杂度为O(1);通过给定值进行查找,需要遍历数组,逐一比对给定关键字和数组元素,时间复杂度为O(n),当然,对于有序数组,则可采用二分查找,插值查找,斐波那契查找等方式,可将查找复杂度提高为O(logn);对于一般的插入删除操作,涉及到数组元素的移动,其平均复杂度也为O(n)   

线性链表:对于链表的新增,删除等操作(在找到指定操作位置后),仅需处理结点间的引用即可,时间复杂度为O(1),而查找操作需要遍历链表逐一进行比对,复杂度为O(n)   

二叉树:对一棵相对平衡的有序二叉树,对其进行插入,查找,删除等操作,平均复杂度均为O(logn)。   

.哈希表:相比上述几种数据结构,在哈希表中进行添加,删除,查找等操作,性能十分之高,不考虑哈希冲突的情况下,仅需一次定位即可完成,时间复杂度为O(1),接下来我们就来看看哈希表是如何实现达到惊艳的常数阶O(1)的。  

 我们知道,数据结构的物理存储结构只有两种:顺序存储结构和链式存储结构(像栈,队列,树,图等是从逻辑结构去抽象的,映射到内存中,也这两种物理组织形式),而在上面我们提到过,在数组中根据下标查找某个元素,一次定位就可以达到,哈希表利用了这种特性,哈希表的主干就是数组。   比如我们要新增或查找某个元素,我们通过把当前元素的关键字 通过某个函数映射到数组中的某个位置,通过数组下标一次定位就可完成操作。         存储位置 = f(关键字)   其中,这个函数f一般称为哈希函数,这个函数的设计好坏会直接影响到哈希表的优劣。举个例子,比如我们要在哈希表中执行插入操作:

  

一、实现原理

HashMap采用数组散列+链表的方式来储存键值对,键值对的对象实现如下:

   static class Entry<K,V> implements Map.Entry<K,V> {  
      final K key;  
     V value;  
      Entry<K,V> next;  
      final int hash;  
    ……  
}  
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

通过一个Entry的数组table就实现了多个对象的保存,使用哈希值和键值解决了在插入和查找时的冲突。

一、put方法,写入键值对

public V put(K key, V value){

 //如果 key 为 null,调用 putForNullKey 方法写入null键的值
 if (key == null){
    return putForNullKey(value);
}

//根据 key 的 keyCode 计算 Hash 值 
int hash = hash(key.hashCode());
//查找hash值在table中的索引
int i = indexFor(hash, table.length);
// 如果 i 索引处的 Entry 不为 null,通过循环不断遍历链表查找是否在链表中有相同key的Entry
for (Entry<K,V> e = tablei; e != null; e = e.next) {
    Object k;
    //找到与插入的值的key和hash相同的Entry
    if (e.hash == hash && ((k = e.key) == key|| key.equals(k)){

        //key值相同时直接替换value值,跳出函数
    V oldValue = e.value;
      e.value = value;
    e.recordAccess(this);
  return oldValue;
        }
    }
// 如果 i 索引处的 Entry 为 null 或者key的hash值相同而key不同  ,则需要新增Entry
modCount++; 
// 将 key、value 添加到 i 索引处
addEntry(hash, key, value, i); 
return null; 
} 
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24

在put方法中解决hash碰撞的方式很清楚,即当两个entry的hash值相同时,需要对key值是否相同进行判断,只有key和hash都相同,才能进行修改,否则认为不是同一个entry。

hashMap整体结构如

  简单来说,HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,其时间复杂度为O(n),首先遍历链表,存在即覆盖,否则新增;对于查找操作来讲,仍需遍历链表,然后通过key对象的equals方法逐一比对查找。所以,性能考虑,HashMap中的链表出现越少,性能才会越好。

addEntry的实现

代码:

void addEntry(int hash, K key, V value, int bucketIndex) 
{ 
  // 获取指定 bucketIndex 索引处的 Entry
Entry<K,V> e = tablebucketIndex;  

tablebucketIndex = new Entry<K,V>(hash, key, value, e); 
     // 如果 Map 中的 key-value 对的数量超过了极限if (size++ >= threshold) 

     resize(2  table.length);

}  
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

在创建新Entry时如果table的bucketIndex处有元素的话,创建时需要将entry的next设置为原先存储的元素。

二、get方法

public V get(Object key)
{
// 如果 key 是 null,调用 getForNullKey 取出null的 value
if (key == null)
return getForNullKey();
// 根据该 key 的 hashCode 值计算它的 hash 码
int hash = hash(key.hashCode());
// 直接取出 table 数组中指定索引处的值,
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
// 搜索该 Entry 链的下一个对象
e = e.next)
{
Object k;
// 如果该 Entry 的 key和hash 与被搜索 key 相同
if (e.hash == hash && ((k = e.key) == key
|| key.equals(k)))
return e.value;
}
return null;
}

实现的原理与get相同。

三、一些需要注意的点

  • 由HashMap的原理可知,主要的储存依赖hash值的计算,因此选用String,Integer这些类做为键会提高HashMap的效率,因为String等对象一旦放入Map中就不会发生变化,因此其hash值也不会发生改变,获取对象的速度将大大提高。
  • 如果HashMap的大小超过了负载因子定义的容量,HashMap将会创建一个原来两倍的bucket数组,将原来的对象放入新的数组中,扩大hashMap的容量。(负载因子初始0.75)
  • 在多个线程同时发现HashMap的大小过小时,都会尝试调整大小,会造成条件竞争。
  • 在Java 8中,如果hash相同的key的数量大于8,会使用平衡树代替链表。

HashMap为什么线程不安全


  • 如上,在两个线程同时尝试扩容HashMap时,可能将一个链表形成环形的链表,所有的next都不为空,进入死循环
  • 在两个线程同时进行put时可能造成一个线程数据的丢失

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值