1.基本概念
散列又称哈希(hash),散列技术是在记录的存储位置和它的关键字之间建立一个确定的对应关系f,使得每个关键字key对应一个存储位置addr=f(key)。散列技术既是一种存储方法又是一种查找方法:存储时通过散列函数(哈希函数)计算出记录的散列地址,并将记录存入此地址;查找时,同样通过散列函数计算出记录的散列地址,然后按此地址访问该记录。
上述方法在理想情况下的效率非常高,但是实际情况下我们要解决一个最大的缺陷就是散列冲突问题。实际中我们会经常遇到的情况是:f(key1)=f(key2),这种现象称为冲突,并把key1、key2称为同义词。
2.散列函数的设计(构造方法)
设计一个好的散列函数并非易事,既要简单易行,又要使散列地址均匀分布,减少冲突,更好的利用存储空间。
常用的散列函数构造方法有:直接定址法、数字分析法、平方取中法、折叠法、除留余数法、随机数法(随机种子的选取很重要)、等等方法。
3.处理散列冲突的方法
既然冲突无可避免,那就想办法解决它。处理散列冲突常用的方法有:开放定址法、再散列法、链地址法(将关键字同义词存储在同一个链表中)、公共溢出区法、等等。