JAVA--HashMap查询的时间复杂度为什么是O(1)

最新推荐文章于 2023-02-28 17:03:49 发布

cuijr_leaf

最新推荐文章于 2023-02-28 17:03:49 发布

阅读量6.2k

点赞数 20

分类专栏： JAVA 数据结构文章标签： java 数据结构

本文链接：https://blog.csdn.net/weixin_42603382/article/details/113369439

版权

JAVA 同时被 2 个专栏收录

9 篇文章 0 订阅

订阅专栏

数据结构

7 篇文章 0 订阅

订阅专栏

写在前面

HashMap查询的时间复杂度是O(1)，这是众所周知的，但是你知道为什么是O(1)吗？

正文

要研究明白这个问题，我们需要从数组开始研究。

数组查询的时间复杂度是O(1)，为什么呢？因为在内存中，数组对象被创建时，是被分配了一块连续的内存地址，这块连续的内存地址上，存放着大小相等的引用类型，在默认情况下，如果虚拟机内存没有超过32GB，那么JVM使用的是32位的压缩指针，也就是说，在这块连续的内存地址上存放的是一个个的32位的压缩指针。现在假设我们的数组中存了10个对象，那么我们如果要找第5个对象，只需要在数组初始位置偏移4*32位就可以了，这意味着数组中所有对象的内存地址我都可以根据数组的初始位置和对象的次序计算出来，知道了对象的内存地址，那么查询的时间复杂度可不就是O(1)嘛。

为了更明白，我拿单向链表来做对比说明。

我们知道单向链表查询的时间复杂度是O(n)，为什么是O(n)呢？因为链表的每个节点的内存地址仅存放在前一个节点中（头节点除外），也就是说如果我要获取当前节点的内存地址，就必须先获取前一个节点的内存地址，如果要获取前一个节点的内存地址，就必须先获取前前一个节点的内存地址，依次类推，知道头节点。那么说如果我要获取这个单项链表中的第n个节点，我就必须从头节点开始，一个一个的查询下去，知道找到这个节点。

单向链表和数组的区别在哪儿呢？就是数组中对象的内存地址可以直接计算出来，而单向链表中对象的内存地址没法计算，只能是一个一个地查找。

好，我们现在搞清楚了数组查询的时间复杂度为什么是O(1)了，是时候来看看HashMap了。

HashMap在内存中是怎么存的呢？换句话说，它的底层是什么样的呢？

看过源码的同学可能知道，它的底层是：数组+链表+红黑树。

其中最主要的是数组，因为只有数组才能实现查询的时间复杂度为O(1)。

现在先不要管链表和红黑树，我们着重来看数组，探究下数组是怎么实现map的。

我们知道，map是key-value集合，跟数组不太一样唉。其实，你跳出来看，数组也是key-value集合，这句话是怎么说的呢？因为我们可以把数组的下标看成是key，数组中存储的对象是value。哎～这样一想是不是有种豁然开朗的感觉？没错！HashMap的底层是数组，当根据key查询value是时候，它就是先根据key来来计算出数组的下标，然后根据从数组中获取对应的value！

这样HashMap就实现了查询的时间复杂度是O(1)!!

好了，看到这里，题目中的问题已经解答完了。

但是如果你想了解的更深一点，比如HashMap是如何根据key求出数组下标的，你可以接着往下看。

首先我们先来看看HashMap的部分源码：

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
    
    ……

    /**
     * The table, initialized on first use, and resized as
     * necessary. When allocated, length is always a power of two.
     * (We also tolerate length zero in some operations to allow
     * bootstrapping mechanics that are currently not needed.)
     */
    transient Node<K,V>[] table;

    ……
}

上面的源码中展示了HashMap中的底层数组，它是个Node<K,V>类型的数组，这个数组叫做table。

我们注意下注释里，它说这个数组的长度永远是2的多少次幂，也就是说数组的长度只能是2，4，8，16，32，，，这类的值，为什么呢？后边讲。

如果想要知道如何求数组下标的，我们只要看看get(Object key)方法的源码就好了。

public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
    
    ……

    public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

    final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                if (first instanceof TreeNode)
                    return ((TreeNode<K,V>)first).getTreeNode(hash, key);
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        return null;
    }

    ……
}


public class Object {

    ……

    public native int hashCode();

    ……

}

我们前面提到过，table数组里存的是Node<K,V>，这里的V就是我们要查询的value，那么如果要查询value，我们只要拿到了Node<K,V>就可以了。在上面的get(Object key)方法中，e就是要查找的Node<K,V>，它是这么查询的：e = getNode(hash(key), key)，我们一个一个地看，先看里边的hash(key)，这个方法的源码也在上边了，我们看到，它是Object类里的native方法，返回值是一个int，OK，记住这个int。再看外面的getNode(hash(key), key)方法，它的源码也在上面了，乍一看，好复杂，不急，再看看，，，还是好复杂，，，为什么复杂呢？因为我们忽略了HashMap的另外两个底层结构--链表和红黑树，这里呢我们还是先不管链表和红黑树，我把上面的源码改一下，改成只用数组的伪代码。

// 以下是伪代码
public class HashMap<K,V> extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable {
    
    ……

    final Node<K,V> getNode(int hash, Object key) {
        Node<K,V>[] tab; Node<K,V> e; int n;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (e = tab[(n - 1) & hash]) != null) {
                return e;
        }
        return null;
    }

    ……
}

这样一看是不是简单了好多？哈哈哈！我们仔细看它的if条件，第一个是(tab = table) != null，这个好理解，就是当前HashMap的table数组中得有值嘛；然后看第二个(n = tab.length) > 0，这个与第一个条件同理；接着最后一个(e = tab[(n - 1) & hash]) != null，这个是最重要的！！！你看它是取了table数组中下标为(n - 1) & hash的Node<K,V>，那么这个(n - 1) & hash就是我们要找的东西。其中hash我们前面提到了，就是一个int，n呢是数组table的长度，也就是说数组的下标是通过key的hashcode和table数组的长度减一做了个与操作获取到的，为什么这样取呢？因为它就是这么存的，，，为什么这么存呢？我们想下，如果数组的长度是10，那么数组的下标就是0～9之间的某个整数，同时key的hashcode是个int，如果我要根据key把这个Node存进去，那么我就需要把key的这个hashcode映射成0～9的某个值，怎么映射呢？答案是hashcode除以10，然后取余数。比如这个key的hashcode是19，那么它除以10取余得9，我就把这个key对应的node存放在数组下标为9的位置，是不是很完美？OK，那这个取余跟(n - 1) & hash有什么关系呢？我们这里需要知道些二进制的知识，我们先要知道n的默认值是16，n-1就等于15，而15的二进制是1111，hashcode跟1111做与操作，结果是什么？结果是hashcde二进制的后四位！同志们，二进制的后四位，恰好是0～15之间的某个值！恰好是数组下标的取值范围！！这也就是我们前面遗留的问题：为什么table数组的长度要设为2的多少次幂！理解了吗？

最后小结一下，key是怎么计算数组下标的。

取key的hashcode跟数组长度减一做与操作！

最后的最后，可能有同学还有疑惑：不同的hashcode除以数组长度取余数可能会得到同一个值啊，那取出的数组下标相同的时候，table数组中的对象是怎么存的呢？

这是个很好的问题，这里就又要提一下我们之前说到的东西：HashMap的底层结构是数组+链表+红黑树。这里呢我下一篇文章再讲吧，因为一篇文章太长的话，就没有读者了。。。。

cuijr_leaf

关注

20
点赞
踩
28

收藏

觉得还不错? 一键收藏
4
评论
JAVA--HashMap查询的时间复杂度为什么是O(1)

写在前面HashMap查询的时间复杂度是O(1)，这是众所周知的，但是你知道为什么是O(1)吗？正文要研究明白这个问题，我们需要从数组开始研究。数组查询的时间复杂度是O(1)，为什么呢？因为在内存中，数组对象被创建时，是被分配了一块连续的内存地址，这块连续的内存地址上，存放着大小相等的引用类型，在默认情况下，如果虚拟机内存没有超过32GB，那么JVM使用的是32位的压缩指针，也就是说，在这块连续的内存地址上存放的是一个个的32位的压缩指针。现在假设我们的数组中存了10个对象，那么我们如果要找
复制链接

扫一扫

专栏目录