(此文为王道数据结构学习笔记,只供个人后续复习使用,若有错误,还望指出我改正,谢谢)
散列表(哈希表):数据元素的关键字与其存储地址直接相关
若通过散列函数映射到同一个值,称之为同义词,如果目标位置已经被占,则冲突
处理冲突的方法——拉链法:把所有同义词放在一个链表中
装填因子(ASL失败):
无元素格记为查找次数0,有1个元素格记为1,有多个元素(同义词)的记为1+2+...+n,故装填因子a=记录数/散列表长度
状态因子记为查找失败的平均查找长度,越大代表冲突越多
常见的散列函数:
除留取余法:H(key) = key % p
散列表表长为m,取一个不大于m但最接近或等于m的质数p
当关键字随机时,用质数p可以使得分布更均匀,冲突更少,装填因子更小
直接定址法:H(key) = key 或 H(key) = a* key + b
这种方法不会冲突,适合关键字的分布基本连续的情况
数字分析法:选取数码分布较为均匀的若干位作为散列地址(例如使用手机号后四位的数字来区分)
平方取中法:取关键字的