面试不再慌，看完这篇保证让你写HashMap跟玩一样

最新推荐文章于 2021-09-13 09:09:05 发布

TechFlow

最新推荐文章于 2021-09-13 09:09:05 发布

阅读量218

点赞数

分类专栏：数据结构算法文章标签：数据结构算法

本文链接：https://blog.csdn.net/TechFlow/article/details/109254344

版权

本文详细解析HashMap的数据结构、hash作用、get、put操作实现，以及复杂度保障和线程安全性。通过理解hash算法如何决定元素存储位置，探讨HashMap在面临数据过多或分布不均时的处理策略，帮助读者掌握HashMap核心原理。

摘要由CSDN通过智能技术生成

今天这篇文章给大家讲讲hashmap，这个号称是所有Java工程师都会的数据结构。为什么说是所有Java工程师都会呢，因为很简单，他们不会这个找不到工作。几乎所有面试都会问，基本上已经成了标配了。

在今天的这篇文章当中我们会揭开很多谜团。比如，为什么hashmap的get和put操作的复杂度是 $O (1)$ ，甚至比红黑树还要快？hashmap和hash算法究竟是什么关系？hashmap有哪些参数，这些参数分别是做什么用的？hashmap是线程安全的吗？我们怎么来维护hashmap的平衡呢？

让我们带着疑问来看看hashmap的基本结构。

基本结构

hashmap这个数据结构其实并不难，它的结构非常非常清楚，我用一句话就可以说明，其实就是邻接表。虽然这两者的用途迥然不同，但是它们的结构是完全一样的。说白了就是一个定长的数组，这个数组的每一个元素都是一个链表的头结点。我们把这个结构画出来，大家一看就明白了。

headers是一个定长的数组，数组当中的每一个元素都是一个链表的头结点。也就是说根据这个头结点，我们可以遍历这个链表。数组是定长的，但是链表是变长的，所以如果我们发生元素的增删改查，本质上都是通过链表来实现的。

这个就是hashmap的基本结构，如果在面试当中问到，你可以直接回答：它本质上就是一个元素是链表的数组。

hash的作用

现在我们搞明白了hashmap的基本结构，现在进入下一个问题，这么一个结构和hash之间有什么关系呢？

其实也不难猜，我们来思考一个场景。假设我们已经拥有了一个hashmap，现在新来了一份数据需要存储。上图当中数组的长度是6，也就是说有6个链表可供选择，那么我们应该把这个新来的元素放在哪个链表当中呢？

你可能会说当然是放在最短的那个，这样链表的长度才能平衡。这样的确不错，但是有一个问题，这样虽然存储方便了，但是读取的时候却有很大的问题。因为我们存储的时候知道是存在最短的链表里了，但是当我们读取的时候，我们是不知道当初哪个链表最短了，很有可能整个结构已经面目全非了。所以我们不能根据这种动态的量来决定节点的放置位置，必须要根据静态的量来决定。

这个静态的量就是hash值，我们都知道hash算法的本质上是进行一个映射运算，将一个任意结构的值映射到一个整数上。我们的理想情况是不同的值映射的结果不同，相同的值映射的结果相同。也就是说一个变量和一个整数是一一对应的。但是由于我们的整数数量是有限的，而变量的取值是无穷的，那么一定会有一些变量虽然它们并不相等但是它们映射之后的结果是一样的。这种情况叫做hash碰撞。

在hashmap当中我们并不需要理会hash碰撞，因为我们并不追求不同的key能够映射到不同的值。因为我们只是要用这个hash值来决定这个节点应该存放在哪一条链表当中。只要hash函数确定了，只要值不变，计算得到的hash值也不会变。所以我们查询的时候也可以遵循这个逻辑，找到key对应的hash值以及对应的链表。

在Python当中由于系统提供了hash函数，所以整个过程变得更加方便。我们只需要两行代码就可以找到key对应的链表。

hash_key = hash(key) % len(self.headers)
linked_list = self.headers[hash_key]

get、put实现

明白了hash函数的作用了之后，hashmap的问题就算是解决了大半。因为剩下的就是一个在链表当中增删改查的问题了，比如我们要通过key查找value的时候。当我们通过hash函数确定了是哪一个链表之后，剩下的就是遍历这个链表找到这个值。

这个函数我们可以实现在LinkedList这个类当中，非常简单，就是一个简单的遍历：

def get_by_key(self, key):
    cur = self.head.succ
    while cur != self.tail:
        if cur.key == key:
            return cur
        cur = cur.succ
    return None

链表的节点查询逻辑有了之后，hashmap的查询逻辑也就有了。因为本质上只做了两件事，一件事根据hash函数的值找到对应的链表，第二件事就是遍历这个链表，找到这个节点。

我们也很容易实现：

def get(self, key):
    hash_key = self.get_hash_key(key)
    linked_list = self.headers[hash_key]
    node = linked_list.get_by_key(key)
    return node

get方法实现了之后，写出put方法也一样水到渠成，因为put方法逻辑和get相反。我们把查找换成添加或者是修改即可：

def put(self, key, val):
    node = self.get(key)
    # 如果能找到，那么只需要更新即可
    if node is not None:

最低0.47元/天解锁文章

TechFlow

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录