HashMap原理

最新推荐文章于 2024-07-20 19:26:35 发布

木鸡呀

最新推荐文章于 2024-07-20 19:26:35 发布

阅读量158

点赞数

分类专栏： java 基础

java 基础专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HashMap是Java常用的用来储存键值对的数据结构，它是线程不安全的，可以储存null键值，这些大家经常用，也都知道，接下来根据源码分析一下HashMap的实现。

数组：采用一段连续的存储单元来存储数据。对于指定下标的查找，时间复杂度为O(1)；通过给定值进行查找，需要遍历数组，逐一比对给定关键字和数组元素，时间复杂度为O(n)，当然，对于有序数组，则可采用二分查找，插值查找，斐波那契查找等方式，可将查找复杂度提高为O(logn)；对于一般的插入删除操作，涉及到数组元素的移动，其平均复杂度也为O(n) 　　

线性链表：对于链表的新增，删除等操作（在找到指定操作位置后），仅需处理结点间的引用即可，时间复杂度为O(1)，而查找操作需要遍历链表逐一进行比对，复杂度为O(n) 　　

二叉树：对一棵相对平衡的有序二叉树，对其进行插入，查找，删除等操作，平均复杂度均为O(logn)。　　

.哈希表：相比上述几种数据结构，在哈希表中进行添加，删除，查找等操作，性能十分之高，不考虑哈希冲突的情况下，仅需一次定位即可完成，时间复杂度为O(1)，接下来我们就来看看哈希表是如何实现达到惊艳的常数阶O(1)的。　

　我们知道，数据结构的物理存储结构只有两种：顺序存储结构和链式存储结构（像栈，队列，树，图等是从逻辑结构去抽象的，映射到内存中，也这两种物理组织形式），而在上面我们提到过，在数组中根据下标查找某个元素，一次定位就可以达到，哈希表利用了这种特性，哈希表的主干就是数组。　　比如我们要新增或查找某个元素，我们通过把当前元素的关键字通过某个函数映射到数组中的某个位置，通过数组下标一次定位就可完成操作。　　　　　　　　存储位置 = f(关键字) 　　其中，这个函数f一般称为哈希函数，这个函数的设计好坏会直接影响到哈希表的优劣。举个例子，比如我们要在哈希表中执行插入操作：

一、实现原理

HashMap采用数组散列+链表的方式来储存键值对，键值对的对象实现如下：

   static class Entry<K,V> implements Map.Entry<K,V> {  
      final K key;  
     V value;  
      Entry<K,V> next;  
      final int hash;  
    ……  
}  
 
 1
2
3
4
5
6
7

通过一个Entry的数组table就实现了多个对象的保存，使用哈希值和键值解决了在插入和查找时的冲突。

一、put方法，写入键值对

public V put(K key, V value){

 //如果 key 为 null，调用 putForNullKey 方法写入null键的值
 if (key == null){
    return putForNullKey(value);
}
 //根据 key 的 keyCode 计算 Hash 值 
int hash = hash(key.hashCode());
//查找hash值在table中的索引
int i = indexFor(hash, table.length);
// 如果 i 索引处的 Entry 不为 null，通过循环不断遍历链表查找是否在链表中有相同key的Entry
for (Entry<K,V> e = tablei; e != null; e = e.next) {
    Object k;
    //找到与插入的值的key和hash相同的Entry
    if (e.hash == hash && ((k = e.key) == key|| key.equals(k)){ 
        //key值相同时直接替换value值，跳出函数
    V oldValue = e.value;
      e.value = value;     e.recordAccess(this);   return oldValue;         }     }
// 如果 i 索引处的 Entry 为 null 或者key的hash值相同而key不同  ，则需要新增Entry
modCount++; 
// 将 key、value 添加到 i 索引处
addEntry(hash, key, value, i); 
return null; 
} 
 
 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

在put方法中解决hash碰撞的方式很清楚，即当两个entry的hash值相同时，需要对key值是否相同进行判断，只有key和hash都相同，才能进行修改，否则认为不是同一个entry。

hashMap整体结构如

　　简单来说，HashMap由数组+链表组成的，数组是HashMap的主体，链表则是主要为了解决哈希冲突而存在的，如果定位到的数组位置不含链表（当前entry的next指向null）,那么对于查找，添加等操作很快，仅需一次寻址即可；如果定位到的数组包含链表，对于添加操作，其时间复杂度为O(n)，首先遍历链表，存在即覆盖，否则新增；对于查找操作来讲，仍需遍历链表，然后通过key对象的equals方法逐一比对查找。所以，性能考虑，HashMap中的链表出现越少，性能才会越好。

addEntry的实现

代码：

void addEntry(int hash, K key, V value, int bucketIndex)  {    // 获取指定 bucketIndex 索引处的 Entry
Entry<K,V> e = tablebucketIndex;   
tablebucketIndex = new Entry<K,V>(hash, key, value, e);       // 如果 Map 中的 key-value 对的数量超过了极限 
if (size++ >= threshold)  
     resize(2  table.length);
 }  
 
 1
2
3
4
5
6

在创建新Entry时如果table的bucketIndex处有元素的话，创建时需要将entry的next设置为原先存储的元素。

二、get方法

public V get(Object key) { // 如果 key 是 null，调用 getForNullKey 取出null的 value if (key == null) return getForNullKey(); // 根据该 key 的 hashCode 值计算它的 hash 码 int hash = hash(key.hashCode()); // 直接取出 table 数组中指定索引处的值， for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; // 搜索该 Entry 链的下一个对象 e = e.next) { Object k; // 如果该 Entry 的 key和hash 与被搜索 key 相同 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) return e.value; } return null; }
实现的原理与get相同。

三、一些需要注意的点

由HashMap的原理可知，主要的储存依赖hash值的计算，因此选用String，Integer这些类做为键会提高HashMap的效率，因为String等对象一旦放入Map中就不会发生变化，因此其hash值也不会发生改变，获取对象的速度将大大提高。
如果HashMap的大小超过了负载因子定义的容量，HashMap将会创建一个原来两倍的bucket数组，将原来的对象放入新的数组中，扩大hashMap的容量。（负载因子初始0.75）
在多个线程同时发现HashMap的大小过小时，都会尝试调整大小，会造成条件竞争。
在Java 8中，如果hash相同的key的数量大于8，会使用平衡树代替链表。