哈希函数

最新推荐文章于 2022-04-02 21:34:45 发布

upupday19

最新推荐文章于 2022-04-02 21:34:45 发布

阅读量853

点赞数

分类专栏：算法文章标签： java lintcode 哈希函数

本文链接：https://blog.csdn.net/upupday19/article/details/78523959

版权

算法专栏收录该内容

66 篇文章 1 订阅

订阅专栏

需求：

在数据结构中，哈希函数是用来将一个字符串（或任何其他类型）转化为小于哈希表大小且大于等于零的整数。一个好的哈希函数可以尽可能少地产生冲突。一种广泛使用的哈希函数算法是使用数值33，假设任何字符串都是基于33的一个大整数，比如：

hashcode("abcd") = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZE

= (97* 333 + 98 * 332 + 99 * 33 +100) % HASH_SIZE

= 3595978 % HASH_SIZE

其中HASH_SIZE表示哈希表的大小(可以假设一个哈希表就是一个索引0 ~ HASH_SIZE-1的数组)。

给出一个字符串作为key和一个哈希表的大小，返回这个字符串的哈希值。

分析：

1、最简单的想法就是逐个遍历字符数组的每个字符，求其ASCII码值和33对应次幂的乘积和，但是这样做会出现溢出的现象，因为和有可能超过long型数的范围

2、为了避免1中提到的溢出问题，可以多次求余。

3、对于"abcd"，可以看成如下步骤

读取字符和

a -> a

b -> a*33+b

c -> (a*33+b)*33+c

d -> ((a*33+b)*33+c)*33+d

......

所以可以得到和的初始值sum=key[0]，之后sum=sum(i-1) * 33 + key[i]

代码：

class Solution {
    /**
     * @param key: A String you should hash
     * @param HASH_SIZE: An integer
     * @return an integer
     */
    public int hashCode(char[] key,int HASH_SIZE) {
        // write your code here
        if(key == null || key.length == 0) {
            return 0;
        }
        
        /*
        //遍历字符数组，求对应的乘积加和，会溢出
        long result = 0;
        for(int i = 0; i < key.length; i++) {
            result += key[i]*Math.pow(33, key.length-1-i);//会溢出
        }
        
        return (int)(result % HASH_SIZE);//会溢出
        */
        
        //初始化和
        long sum = key[0];
        
        for(int i = 1; i < key.length; i++) {
            sum = sum * 33 % HASH_SIZE + key[i];//及时取余，避免溢出
        }
        
        return (int)(sum % HASH_SIZE);
    }
}