HashMap的结构:结合数组和链表的结构,在数组中存储链表,链表的节点中存储键值对。这样的结构结合了数组高效访问的优势和链表高效增删的优势。(数组和链表是所有数据结构的祖宗)
HashMap的存储流程:<k,v>键值对封装存储在链表的节点中,节点分为Entry和链接两部分,Entry存储键值对,链接存储下一个节点的引用。通过hashCode()求得键k的哈希值,通过哈希值计算得到数组中的下标,最终将存储键值对的节点链接到数组中,如果已存在相同键,则更改节点的值。(哈希值是整数int类型)
其中存在的问题是:
1、不同的对象,通过hashCode()求得的哈希值可能相同。本质上hashCoed()是将输入转变为数字,按固定方式计算输出相应哈希值的函数。由于int类型有范围限制,输入没有范围限制,因此会存在多个输入对应一个输出的情况,也就是不同的输入有相同的哈希值。
总结就是,存在不同的输入有相同哈希值的情况。也就是,存在多个输入对一个哈希值的情况。
2、在HashMap结构中,哈希值与数组的下标相对应。哈希值的范围远大于数组的范围,因此存在多个哈希值对一个数组下标的情况。
解决问题的方法有:
拉链法/链地址法。拉链法是在数组中存储链表,将具有相同散列地址的键值对,通过一条同义词链表存储。散列地址与内存中的地址完全不同,散列地址是数组中的下标,内存中的地址是物理内存中的地址。
其中要用到两个重要的方法:hashCode()和equals()
hashCode()的作用是:求得哈希值。
equals()的作用是:比较两对象的值是否相等。(“==”比较的是地址是否相同,不是地址中存储的值是否相同。Objects类中定义的equals方法任然是通过“==”比较地址,在具体的类中通常需要重写equals方法)
通过hashCode()得到HashMap中内部数组的下标,在同义词链表中通过equals()方法找到键k存储的节点,如果没有已存在的节点,则增加新节点。
在键k所属的类中重写equals()方式时,需要保证该类中的hashCode()方法得到相同的哈希值。这样才能保证equals()判断相等的两个对象,找到同一个同义词链表。