周末男朋友给我讲了散列存储。整理了下,还望高人多多指点。
散列存储:就是把任意长度的输入,通过散列算法,编程固定长度的输出,该输出就是散列值。通常,散列值的空间远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。
hashmap用了table这个数组,还有若干个名字为entry的链表。
当插入<key,value>时,HashMap首先会通过key得到它的hashCode。然后把key的(hashCode%table.length)作为key所在table数组中的下标(实际不是key的下标,是entry类);但这样做可能导致一个问题就是,不同的key有相同的hashcode,所以求余后其必然会得到相同的下标。
解决办法:1.让后来相同的hashcode去找先来的hashcode所在下标的相邻下标。
2.利用链式存储
那么HashMap到底使用的是那种方法呢?
首先,第一种方法一般需要2倍实际数据大小的空间,因为要留下一部分地址去存储相同哈希吗的键值。并且查询相邻空闲地址也是一项比较费时间的任务;而链式存储就不要了,但是需要额外的信息,比如next信息。总的来说还是链式存储要好。所以hashmap用的是链式存储。