1.哈希定义
哈希表通过记录关键字为自变量的函数(称为哈希函数)得到访记录的存储地址查找,所以在哈希表中进行查找操作时,须用同一哈希函数计算得到待查询记录的存储地址,然后到相应的存储单元去获得相关信息再判定查找是否成功。
根据设计哈希函数H(key)和处理冲突的方法,将一组关键字映射到一个有限连限的地址集(区间)上,并以关键字在地址集中的“像”为记录在表中的存储位置,这种表称为哈希表,这一映射过程为哈希造表或散列,所得的存储位置称为哈希地址或散列地址。
冲突定义:对于某个哈希函数H(K)和两个关键字K1和K2,如果K1<>K2,而H(K1)=H(K2),则称为冲突。具有相同哈希函数值的关键字对该哈希函数来说称为同义词。
一般情况,冲突只能尽可能减少而不能完全避免,因为哈希函数是从关键字集合到地址集合映像。通常关键集合比较大,它的元素包含所有可能的关键字,而地址集合的元素仅为哈希表中的地址值。
对于哈希表,主要考虑两个问题:一是如何构造哈希函数,二是如何解决冲突。
2.哈希构造函数
Hash构造即为关键字与哈希地址映射关系建立。
构造哈希函数的原则是:①函数本身便于计算;②计算出来的地址分布均匀,即对任一关键字k,f(k) 对应不同地址的概率相等,目的是尽可能减少冲突。
哈希函数的构造方法很多,常用的有直接定址法、数字分析法、平方取中法、折叠法、除留余数法、随机数法等。
3.哈希表实现
import java.util.TreeMap;
public class HashTable<K, V> {
//利用TreeMap封装成一个数组
//数组:每个元素存放着键和值
private TreeMap<K, V>[] hashtable;
//哈希表中的元素个数
private int size;
//哈希表的长度
private int M;
public HashTable(int M){
this.M = M;
size = 0;
//开辟数组空间
hashtable = new TreeMap[M];
//对每一个TreeMap进行实例化
for(int i = 0 ; i < M ; i ++){
hashtable[i] = new TreeMap<>();
}
}
public HashTable(){
this(97);
}
//先将key转化成整型,消除符号
private int hash(K key){// 为啥要把hash值和0x7FFFFFFF做一次按位与操作呢,
// 主要是为了保证得到的index的第一位为0,也就是为了得到一个正数。
// 因为有符号数第一位0代表正数,1代表负数。
return (key.hashCode() & 0x7fffffff) % M;
}
public int getSize(){
return size;
}
public void add(K key, V value){
//根据hash(key)索引取出hashtable中的元素
TreeMap<K, V> map = hashtable[hash(key)];
//看map中是否包含了key
if(map.containsKey(key)){
//修改
map.put(key, value);
}else{
//添加
map.put(key, value);
size ++;
}
}
public V remove(K key){
//递归返回令该元素为空
V ret = null;
TreeMap<K, V> map = hashtable[hash(key)];
if(map.containsKey(key)){
ret = map.remove(key);
size --;
}
return ret;
}
public void set(K key, V value){
TreeMap<K, V> map = hashtable[hash(key)];
if(!map.containsKey(key)){
throw new IllegalArgumentException(key + " doesn't exist!");
}
map.put(key, value);
}
public boolean contains(K key){
return hashtable[hash(key)].containsKey(key);
}
public V get(K key){
return hashtable[hash(key)].get(key);
}
}