什么是哈希表?
哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。映射的存储位置=f(关键字)。这里的对应关系f称为散列函数,又称为哈希(Hash函数),采用散列技术将记录存储在一块连续的存储空间中,这块连续存储空间称为散列表或哈希表(Hash table)。
哈希函数
:就是将key通过一个固定的算法转换成一个整形的数字,然后对数组长度取余,取余后的值作为数组的下标。并将value存储在以取余的值为数组下标的数组空间里。
哈希表-拉链法
数组的优点
是:可以通过数组的下标快速定位位置,并快速取出该位置的值。缺点
:删除、添加操作比较麻烦
链表的优点
:便于插入和删除。缺点
:不能快速定位位置。如果定位某一位置需要遍历操作。
-
哈希表的拉链法很好的将数组和链表的优点结合在一起。
左边对应的是数组,取余的值即作为数组的下标。数组中存有指针,当取余的值作为数组下标时,此数组下标已经被存储了。这时此数组下标中的指针会指向下一个位置,并将其存储在此位置里。这样就实现了数组和链表的结合。
-
由于数组创建后的长度难于扩展,当数组被填满时,就会往链表中填写。由于链表过多的写入,哈希表的性能会越来越低。所以要根据存储情况来申请数组长度。
哈希表-拉链法的代码实现
public class MyMap {
//哈希表的代码实现
Node[] nodes = new Node[100]; //申请的数组的大小
//泛型
class Node<K, V> {
K key;
V value;
Node next;//指针
}
public void add(String name, Student stu) {
Node node = new Node();
node.key = name;
node.value = stu;
//散列算法,大概是哈希表的用法
int code = name.hashCode();//获取那么的hash码,也就是哈希函数获取的一个整数
if(nodes[code%nodes.length] != null) {//数组已经满了
//头插法插入
node.next=nodes[code%nodes.length].next;
nodes[code%nodes.length].next=node;
} else {//数组未满
nodes[code%nodes.length] = node;
}
}
}
我们通过name的hash码,来确定其在数组中的位置。
那么我们查找的时候,也是通过hash码查找。
总结
哈希表是一种数据结构,可以进行插入和查找的操作。也可以根据key来快速定位value的位置,并取出其值(即查找)。但是如果一个key对应多个散列地址(即取余的值相同),那么查找时无异于对链表进行查找。
所以好的散列函数=计算简单+分布均匀(计算得到的散列地址分布均匀)