数据结构——散列查找
引子
已知的几种查找方法:
- 顺序查找… O ( N ) O(N) O(N)
- 二分查找(静态查找) … O ( l o g 2 N ) O(log_2N) O(log2N)
- 二叉树 … O ( h ) O(h) O(h) h为二叉树的高度
- 平衡二叉树 … O ( l o g 2 N ) O(log_2N) O(log2N)
查找的本质:已知对象找位置
有序安排对象:全序、半序
直接“算出”对象位置: 散列
散列查找法的两项基本工作:
计算位置:构造散列函数确定关键词存储位置;
解决冲突:应用某种策略解决多个关键词位置相同的问题
时间复杂度几乎是常量: O ( 1 ) O(1) O(1),即查找时间与问题规模无关。
散列表
基本概念
散列表(哈希表)
类型名称: 符号表(SymbolTable)
数据对象集: 符号表是“名字(Name)-属性(Attribute)”对的集合。
操作集: Table ∈ \in ∈SymbolTable, Name ∈ \in ∈NameType, Attr ∈ \in ∈AttributeType,以及正整数TableSize,符号表的基本操作主要有:
1. SymbolTable InitializeTable(int TableSize):创建一个长度为TableSize的符号表;
3. Boolean IsIn(SymbolTable Table, NameType Name):查找特定的名字Name是否在符号表Table中;
4. AttributeType Find(SymbolTable Table, NameType Name):获取Table中指定名字Name对应的属性;
5. SymbolTable Modefy(SymbolTable Table, NameType Name, AttributeType Attr):将Table中指定名字Name的属性改为Attr;
6. SymbolTable Insert(SymbolTable Table, NameType Name, AttributeType Attr):向Table中插入一个新名字Name及其数组Attr;
7. SymbolTable Delete(SymbolTable Table, NameType Name):从Table中删除一个名字Name及其属性。
例1: 有n=11个数据对象的集合{18, 23, 11, 20, 2, 7, 27, 30, 42, 15, 34}。
“散列(Hashing)”的基本思想:
- 以关键字key为自变量,通过一个确定的函数h(散列函数),计算出对应的函数值h(key),作为数据对象的存储地址。
- 可能不同的关键字会映射到同一个散列地址上,即 h ( k e y i ) h(key_i) h(keyi)= h ( k e y j ) h(key_j) h(keyj),(当 k e y i key_i keyi ≠ \neq = k e y j key_j key