哈希表:
哈希表维持一个数组,对每个添加的元素,利用哈希函数生成key对应的index,将key相关数据存放在数组中。以使得每次存取或查找元素时间复杂度为O(1)。
哈希表是“空间换时间”的典型应用。
哈希冲突是指对不同key计算出相同的index值,此时一般解决办法是在该索引位置构造单链表,将相同index值的不同key构造的单链表存放到同一个index的数据域(该数据域存放单链表表头地址)中。
哈希函数:
哈希函数满足以下条件:
1.对于同一个key每次计算必须得出同一个index值。
2.应充分利用key中所有数据,即让所有数据都参与哈希函数计算index的运算。
3. 计算哈希值的过程尽可能简单,在O(1)内完成,且计算结果数据分布均匀。
4. 哈希碰撞尽可能少。
哈希函数通常实现:
整型数据以数值作为哈希值。
float型数据以其在计算机中的二进制字符串表示的整型数据作为哈希值。
long类型数据将数据采用无符号右移32位后的结果与原数据进行异或运算,并将运算结果强制类型转换为整型作为哈希值。
double 型数据的计算与long 类似,用前32位二进制位与后32位二进制位进行异或运算。
String 型数据的计算过程是:初始hash=0;将字符串中字符依次取出(记为ch[i]),每次执行hash=(hash<<5)-hash+ch[i];
对与自定义类型, 将类型各个域分别求哈希值,再使用类似求String 类型哈希值的方式,将自定义类型中各个域的哈希值参与运算求出最后的哈希值。
说明:对于String 类型,如:
String s="abc";
//计算方式是:hash=a*31^2+b*31^1+c*31^0;
//取参数31是因为它与字符总数接近,并且由于在String 类型计算hash过程中经常使用i*31的操作,可对*31进行优化:i*31=(i<<5)-i;