散列存储

最新推荐文章于 2022-04-25 16:22:27 发布

weixin_34413802

最新推荐文章于 2022-04-25 16:22:27 发布

阅读量218

点赞数

文章标签： python 数据结构与算法

原文链接：https://my.oschina.net/nobodyhi/blog/71582

版权

2019独角兽企业重金招聘Python工程师标准>>>

周末男朋友给我讲了散列存储。整理了下，还望高人多多指点。

散列存储：就是把任意长度的输入，通过散列算法，编程固定长度的输出，该输出就是散列值。通常，散列值的空间远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。

hashmap用了table这个数组，还有若干个名字为entry的链表。

当插入<key,value>时，HashMap首先会通过key得到它的hashCode。然后把key的（hashCode%table.length）作为key所在table数组中的下标（实际不是key的下标，是entry类）；但这样做可能导致一个问题就是，不同的key有相同的hashcode，所以求余后其必然会得到相同的下标。

解决办法：1.让后来相同的hashcode去找先来的hashcode所在下标的相邻下标。

2.利用链式存储

那么HashMap到底使用的是那种方法呢？

首先，第一种方法一般需要2倍实际数据大小的空间，因为要留下一部分地址去存储相同哈希吗的键值。并且查询相邻空闲地址也是一项比较费时间的任务；而链式存储就不要了，但是需要额外的信息，比如next信息。总的来说还是链式存储要好。所以hashmap用的是链式存储。

转载于:https://my.oschina.net/nobodyhi/blog/71582