理想情况下HashMap的时间复杂度为O(1),因为对于内存来说,访问任何地址的时间是一样的,即时间极短,相当于可以同时访问到所有地址。
而在时间复杂度为O(1)时,需要很大的内存空间,所以必须要对内存和时间进行取舍。
如何取舍,hashmap在初始化的时候有俩值,初始大小和负载因子,默认是16和0.75
大小不用解释,负载因子就是一个小数,扩容的时候用的,在put的时候,hashmap就检查一下自己的大小,是不是大于16x0.75(大小x负载因子),如果是,就扩容,扩容到2^n,而hash值要进行取余运算,hash%(2^n)=hash^(2^n-1),为了效率,就采用了2倍的扩容。
我们看下面的方法:
public V get(Object key) { if (key == null) return getForNullKey(); int hash = hash(key.hashCode()); for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; e = e.next) { Object k; if (e.hash == hash && ((k = e.key) == key || key.equals(k))) return e.value; } return null; } |
1.判断key,根据key算出索引。
2.根据索引获得索引位置所对应的键值对链表。
3.遍历键值对链表,根据key找到对应的Entry键值对。
4.拿到value。
只有以上四步都能在O(1)时间内完成,hashmap才能拥有O(1)的时间复杂度。步骤1(计算)、步骤2(数组的查找)和步骤4(从键值对中取value值)都可以在O(1)时间内完成。那么,步骤3中链表的长度决定了整个hashmap容器的查找效率,这也是hashmap容器设计的关键。必须采用优秀的hash算法以减少“冲突”,使得链表的长度尽可能短,理想状态下链表长度都为1。
总结:
1)hashmap容器O(1)的查找时间复杂度只是其理想的状态,而这种理想状态需要由java设计者去保证。
2)在由设计者保证了链表长度尽可能短的前提下,由于利用了数组结构,使得key的查找在O(1)时间内完成。
3)可以将hashmap分成两部分来看待,hash和map。map只是实现了键值对的存储,也就是以上查询步骤的第4步。而其整个O(1)的查找复杂度很大程度上是由hash来保证的。