简介
常见的数据结构有三种:数组结构、链表结构、哈希表结构,它们的的特点如下所示:
1、数组结构: 存储区间连续、内存占用严重、空间复杂度大。
优点:随机读取和修改效率高,因为数组是连续的(随机访问性强,查找速度快)。
缺点:插入和删除数据效率低,因为插入数据时,这个位置后面的数据在内存中都要往后移动,且大小固定不易动态扩展。
2、链表结构:存储区间离散、占用内存宽松、空间复杂度小。
优点:插入删除速度快,内存利用率高,没有固定大小,扩展灵活。
缺点:不能随机查找,每次都是从第一个开始遍历(查询效率低)。
3、哈希表结构:结合数组结构和链表结构的优点,从而实现了查询和修改效率高,插入和删除效率也高的一种数据结构。
hashMap结构图
常见的hashMap就是一种哈希表结构,如下图所示
hashMap中put方法的实现原理
下图所示为put方法的实现流程,详细过程下文将以源码为基础详细展开分析
hashMap源码中重要的成员变量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;//初始容量,为16,必须为2的次幂
static final int MAXIMUM_CAPACITY = 1 << 30;//table数组的最大长度
static final int MIN_TREEIFY_CAPACITY = 64;//table数组的最小长度
static final float DEFAULT_LOAD_FACTOR = 0.75f;//当容量被占满0.75时就需要reSize扩容
static final int TREEIFY_THRESHOLD = 8;//链表长度到8,就转为红黑树
static final int UNTREEIFY_THRESHOLD = 6;// 树大小为6,就转回链表
Node是hashMap的一个内部类,实现了Map.Entry接口,本质就是一个映射(键值对) ,源代码如下
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
public final K getKey() { return key; }
public final V getValue() { return value; }
public final String toString() { return key + "=" + value; }
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}
public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
put方法源码
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
首先先来了解put方法中hash方法的含义
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
上图操作是把key与其高16位进行异或得到一个哈希值以便存放进table数组的对应位置
putVal方法是put方法的具体实现,其实现流程如下图所示
// 参数onlyIfAbsent表示是否替换原值
// 参数evict主要用来区别是通过put添加的还是创建时初始化数据
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 空数组,需要初始化
if ((tab = table) == null || (n = tab.length) == 0)
// resize()不仅用来调整容量大小,还用来进行初始化配置
n = (tab = resize()).length;
//这里就是看下在hash位置有没有元素,实际位置是hash % (length-1),也就是取余操作
if ((p = tab[i = (n - 1) & hash]) == null)
// 将元素直接插进去
tab[i] = newNode(hash, key, value, null);
else {
// 如果对应下标的位置已经有元素就需要添加链表或红黑树
// e是用来查看是不是待插入的元素已经有了,有就替换
Node<K,V> e; K k;
// p是存储在当前位置的元素
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p; //要插入的元素就是p,这说明目的是修改值
// p是一个树节点
else if (p instanceof TreeNode)
// 把节点添加到树中
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
// 这是链表结构,要把待插入元素挂在链尾
for (int binCount = 0; ; ++binCount) {
//没有循环条件可以直接进入循环,且根据需求向后循环
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 链表比较长,需要树化,
// 由于初始即为p.next,所以当插入第8个元素才会树化
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 找到了对应元素,就可以停止了
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
// 继续向后
p = e;
}
}
// e就是被替换出来的元素,这时候就是修改元素值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
// 默认为空实现,允许我们修改完成后做一些操作
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
// size太大,达到了capacity的0.75,需要扩容
if (++size > threshold)
resize();
// 默认也是空实现,允许我们插入完成后做一些操作
afterNodeInsertion(evict);
return null;
}
总结
hashMap在put方法中,使用了hashCode()和equals()方法。当我们通过传递key-value键值对调用put方法时,hashMap使用哈希算法来找出存储key-value键值对的对应索引。如果索引处为空,则直接插入到数组中,否则,判断是否是红黑树,若是,则红黑树插入,否则遍历链表,当链表长度大于8,将链表转为红黑树,转成功之后再插入。