HashMap

最新推荐文章于 2020-08-24 08:19:05 发布

Daria_

最新推荐文章于 2020-08-24 08:19:05 发布

阅读量297

点赞数

分类专栏： Java集合框架库

本文链接：https://blog.csdn.net/Daria_/article/details/88422080

版权

Java集合框架库专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一、哈希表

哈希表：也叫散列表，是根据关键码值而直接进行访问的数据结构，即它通过把关键码值来映射到表的一个位置来访问记录，以加快查找速度，这个映射函数叫哈希函数；
在这里插入图片描述
图片来自网络

哈希函数:键与值映射的一个映射关系

常用的哈希函数：

直接寻址法：取关键字或关键字的某个线性函数为地址
- f(x) = kx + b (k、b为常数)

除留余数法：取关键字被某个不大于哈希表长度m的数k除后所得余数为地址
- f(x) = x%k (k <= m) [m为存储位置长度]
平方取中法：当无法确定关键字中哪几位分布较均匀时，可以先求出关键字的平方值，然后按需要取平方值的中间几位作为哈希地址；因为平方后中间几位和关键字中每一位都相关，故不同关键字会以较高的概率产生不同的哈希地址；
折叠法：将关键字分割成位数相同的几部分，最后一部分位数可以不同，然后取这几部分的叠加和（去除进位）作为地址
- 数位叠加可以有移位叠加和间接叠加两种方法：
  - 移位叠加是将分割后的每一部分的最低位对齐，然后相加；
  - 间界叠加是从一端向另一端沿分割界来回折叠，然后对齐相加；
随机数法：选择一随机函数，取关键字的随机值作为散列地址，通常用于关键字长度不同的场合；

哈希冲突：m != n 但是 f(m) == f(n)

解决哈希冲突的方法：

开放寻址法：Hi=(H(key) + di) MOD m,i=1,2，…，k(k<=m-1），其中H(key）为散列函数，m为散列表长，di为增量序列，可有下列三种取法
- di=1,2,3，…，m-1，称线性探测再散列；
- di=1^2,-12,2^2,-22，⑶^{2，…，±（k)}2,(k<=m/2）称二次探测再散列；
- di=伪随机数序列，称伪随机探测再散列
再散列法
链地址法

二、HashMap在JDK1.7和JDK1.8的区别???

（1）JDK1.7用的是头插法，而JDK1.8及之后使用的都是尾插法，那么他们为什么要这样做呢？因为JDK1.7是用单链表进行的纵向延伸，当采用头插法时会容易出现逆序且环形链表死循环问题。但是在JDK1.8之后是因为加入了红黑树使用尾插法，能够避免出现逆序且链表死循环的问题。
（2）扩容后数据存储位置的计算方式也不一样：1. 在JDK1.7的时候是直接用hash值和需要扩容的二进制数进行&（这里就是为什么扩容的时候为啥一定必须是2的多少次幂的原因所在，因为如果只有2的n次幂的情况时最后一位二进制数才一定是1，这样能最大程度减少hash碰撞）（hash值 & length-1）
（3）JDK1.7的时候使用的是数组+ 单链表的数据结构。但是在JDK1.8及之后时，使用的是数组+链表+红黑树的数据结构（当链表的深度达到8的时候，也就是默认阈值，就会自动扩容把链表转成红黑树的数据结构来把时间复杂度从O（n）变成O（nlogN）提高了效率）

三、HashMap(JDK1.7)

1. 继承关系

 public class HashMap<K,V> extends AbstractMap<K,V>implements Map<K,V>, Cloneable, Serializable

HashMap继承AbstractMap<K,V>类（jdk 1.2之后），实现Map接口，Cloneable和 Serializable接口，可以克隆，也可以序列化；

2.基本属性

HashMap底层的实现是数组+链表实现:数组中存储的是一个个entry实体，hash到同一个索引位置的数据通过链表链接起来；

transient Node<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;

static class Entry<K,V>{
   final K key; //键值对的key
   V value;   //键值对的value
   Entry<K,V> next;  //next节点
   int hash;  //和key相关的hash
}

transient Set<Map.Entry<K,V>> entrySet;
transient int size; //hashMap中存储entry实体的个数
transient int modCount; //版本号
int threshold; //扩容的阈值，即map的最大容量  capacity * loadFactor 容量*加载因子
final float loadFactor; //加载因子

3. 默认值

private static final long serialVersionUID = 362498820763181265L;
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //哈希表中数组默认初始容量为16
static final int MAXIMUM_CAPACITY = 1 << 30; //哈希表中数组的最大容量值
static final float DEFAULT_LOAD_FACTOR = 0.75f; //默认加载因子 ，用于扩容
static final Entry<?,?>[] EMPTY_TABLE = {}; //空数组


static final Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE; //table初始化大小为2的指数次方
static final int TREEIFY_THRESHOLD = 8;
static final int UNTREEIFY_THRESHOLD = 6;
static final int MIN_TREEIFY_CAPACITY = 64;

4. 特点

HashMap底层采用数组+链表存储key-value键值对，数组的默认容量为16；
扩容时定义一个新的数组，长度为2*table.length,再将原来的元素进行重哈希存入新的数组中；
根据其存储的元素又有以下特点：
- 键可以为null，值也可以为null；
- 键不能重复，值可以重复；
- 不能保证插入有序；

5.构造函数

可以看出，数组并未在HashMap的构造函数中进行初始化

//指定初始容量、指定加载因子
public HashMap(int initialCapacity, float loadFactor) {
    //基本的参数校验
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +loadFactor);
    //加载因子、扩容阈值初始化
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
    init();
}

//通过默认加载因子和默认容量初始化
public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}

//通过默认加载因子和指定容量初始化
public HashMap(int initialCapacity) {
    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

//通过Map集合来初始化当前集合
public HashMap(Map<? extends K, ? extends V> m) {
    this.loadFactor = DEFAULT_LOAD_FACTOR;
    putMapEntries(m, false);
}

6. HashMap常用方法

	put(); //添加
    int size(); //map中存储键值对的个数
    boolean isEmpty(); //判断集合是否为空
    boolean containsKey(); //判断键是否存在
    boolean contiansValue(); //判断值是否存在
    void putAll(Map<? extends K,); //将map集合添加至该集合中 
    void clear(); //清除集合

7. 数组增长方式

当size>=扩容阈值threshold时，数组进行扩容，新的数组长度为2*table.length
在这里插入图片描述
8. 增删方式

put()方法添加元素

public V put(K key, V value) {
     //第一次插入元素，需要对数组进行初始化：注意：数组大小为2的指数关系
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    //可以存储key为null的情况
    if (key == null)
        return putForNullKey(value);
        
    //key不为null 
    //通过key来哈希找到该数据所存在的索引位置：key相关的哈希值   
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    //遍历该位置i下面的链表：（判断key是否存在，存在替换value，不存在创建新entry）
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

插入key为null情况
- key为null做特殊处理，存储在table[0]号索引位置；
- 遍历该位置下的链表，查看key为null的节点是否存在，存在即将value更新为传入的value；
- 若该链表下不存在则创建新的entry节点插入该链表(调用addEntry())；

private V putForNullKey(V value) {
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(0, null, value, 0);
    return null;
}

插入key不为null的情况
- 通过key来哈希得到对应存储位置；
- 遍历该位置下的链表，查看key为null的节点是否存在，存在即将value更新为传入的value；
- 若该链表下不存在则创建新的entry节点插入该链表(调用addEntry())；

    final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }
        h ^= k.hashCode();
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

static int indexFor(int h, int length) {
        // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
        return h & (length-1);
    }

扩容时机：当前存储元素的个数size>=扩容阈值threshold时考虑扩容
扩容大小为2倍的数组大小table.length(数组要满足2的指数级关系)

void addEntry(int hash, K key, V value, int bucketIndex) {
     newCapacity(table.length) *loadFactor
    if ((size >= threshold) && (null != table[bucketIndex])) {
        //扩容
        resize(2 * table.length);
        
        //更新新插入元素的索引位置
        hash = (null != key) ? hash(key) : 0;
        bucketIndex = indexFor(hash, table.length);
    }

	//不考虑扩容则调用createEntry()
    createEntry(hash, key, value, bucketIndex);
}

//扩容函数
void resize(int newCapacity) {
    Entry[] oldTable = table;
    int oldCapacity = oldTable.length;
    if (oldCapacity == MAXIMUM_CAPACITY) {
        threshold = Integer.MAX_VALUE;
        return;
    }

    Entry[] newTable = new Entry[newCapacity];
    transfer(newTable, initHashSeedAsNeeded(newCapacity));
    table = newTable;
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
}

创建新的table数组，并且将原来集合上的元素全部进行hash，找到新的对应位置进行插入

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry<K,V> e : table) {
        while(null != e) {
            Entry<K,V> next = e.next;
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

添加结点：将元素作为当前索引位置的头部元素进行插入

void createEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
    table[bucketIndex] = new Entry<>(hash, key, value, e);
    size++;
}

get()方法获取元素:

通过键值key来查找value

public V get(Object key) {
    if (key == null)
        return getForNullKey();
    Entry<K,V> entry = getEntry(key);
    return null == entry ? null : entry.getValue();
}

判断key是否为null，是则特殊处理，直接到0号索引位置查找元素
先通过hash找到索引位置，通过索引位置找到当前链表，通过判断key是否相等找到value进行返回
判断元素相等的条件：

e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))

其中：

hash值相等且e.key==key 为当key为null时的判断条件；

e.hash == hash &&(k = e.key) == key

当key不为null时，判断条件为hash值相等，然后用.equals方法判断key值相等；

e.hash == hash &&(key != null && key.equals(k))

final Entry<K,V> getEntry(Object key) {
    if (size == 0) {
        return null;
    }
    int hash = (key == null) ? 0 : hash(key);
    for (Entry<K,V> e = table[indexFor(hash, table.length)];
         e != null;
         e = e.next) {
        Object k;
        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
            return e;
    }
    return null;
}

remove():删除元素

结合前面的put()和get()方法来看remove()方法就比较容易了

public V remove(Object key) {
    Entry<K,V> e = removeEntryForKey(key);
    return (e == null ? null : e.value);
}

final Entry<K,V> removeEntryForKey(Object key) {
    if (size == 0) {
        return null;
    }
    int hash = (key == null) ? 0 : hash(key);
    int i = indexFor(hash, table.length);
    Entry<K,V> prev = table[i];
    Entry<K,V> e = prev;

    while (e != null) {1   
        Entry<K,V> next = e.next;
        Object k;
        if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))) {
            modCount++;
            size--;
            if (prev == e)
                table[i] = next;
            else
                prev.next = next;
            e.recordRemoval(this);
            return e;
        }
        prev = e;
        e = next;
    }
    return e;
}