好了,今天就来讲一下我个人对哈希表的理解吧。
哈希表也被称作散列表,是通过一对对的键值对来完成的,即key-value;
还是举个栗子说明一下这个键值对吧,比如:
电影票看作为关键字(key),电影看作为它所对应的值(value)。电影票价随意写的
这样大家对于键值对应该有些了解了吧,说白了key就像value的坐标一样,你要去找到这个坐标就可以找到相应的值。
再打个比方,很多同学可能会遇到班里有同名不同姓的同学,就叫小明吧,如果一个人要找小明,刚好要找的小明不在教师,而那个人跟你说在教室,你去了发现找的不是他,如果你说你要找的是姓王的小明,那就直接可以找到了,姓就可以直接作为关键字(key)。
所以说哈希表通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做哈希算法。
哈希算法:
哈希算法有很多种,今天主要讲解用的最多的除留余数法。
除留余数法:f(k)=k%m.k即是关键字,m是一个小于哈希表表长的一个质数(素数)。
这时不知道大家有没有跟我一样的疑问,直接用表长代替所谓的m不就行了吗,何必还要计算素数那么麻烦。其实直接用表长也不是不可以,就是效果不是那么好。举个栗子给大家就明白了。
栗子:假设哈希表的表长为4,关键字为16,24,64,9.利用除留余数法你会发现得到的全是0,也就是所谓的冲突了。所有的元素都集中在了下标为0的哈希桶上了,这样会使得查找效率降低,平均查找长度为((4+1)*4/2)/4=2.5,那还不如直接用数组呢,还不浪费那么多的空间。
依然是上面的栗子,如果这次的m取小于等于他的素数,取m=3;相对来说比较均匀,平均差很早长度为(3*1+2*1)/4=1.25,所以大家明白了吧,其实也不是全部都要取素数,看情况,不过所有情况都取那就是准没错的。
解决冲突:
上面栗子中,如果m取表长4的话,就是产生冲突,怎么解决呢,上面栗子就是其中的方法之一,也就是链地址法(拉链法)。其中现行线性探测法也是用的相对较多的。
线性探测法:
最后存放4的时候会发现产生了冲突,4存入的位置已经存放有9了,发生了冲突,利用线性探测来解决。即找到下一个位置,发现下一个位置也存放了数字15,再往下直到找到空位置。即j=k%m,发生冲突时,j=(j+di)%(表长)(其中di=1,2,3,4,.....),所以4在下标为2的为位置才找到空位置。
代码:
主函数:
创建哈希表函数:
求解素数函数:
哈希算法:
整体代码:
最后讲一下拉链式创建哈希表:
代码思想:
定义:
主函数:
哈希表创建函数:
创建的步骤:
素数求解和哈希算法:
整体代码:
结果:输入loveleetcode