定义
散列是一种用于以常数平均时间执行插入、删除和查找的技术。但是并不支持元素间需要排序信息的操作,比如FindMin()、FindMax()等。
散列表数据结构
理想的散列表数据结构不过是一个包含有关键字的具有固定大小的数组。
每个关键字被映射到0~TableSize-1中的某个数,这个映射被称为散列函数(hash function)。理想状况下的散列函数应该运算简单且保证任何两个不同的关键字映射到不同的单元,但是对于有限长度的散列表,不可能容纳无限的关键字,所以我们要寻找一个合适的散列函数将关键字均匀的映射到不同的单元。
当两个关键字散列到同一个单元时,我们称之为发生冲突(collision)。
散列函数
- 通常保证表的大小为素数。
- emmm,找到一个好的散列函数——足够大,足够快,平均分布。
- 当冲突发生时,我们通过两种方法来解决冲突:
- 分离链接法
- 开放定址法
- 以后补充。
分离链接法
做法:将散列到同一个值的所有元素保留到一个表中。