利用前缀和-o(1)求字符串hash值

背景

到什么是字符串哈希(Hash)?很多人都会疑惑,我们可以这么理解,定义一个把字符串映射到整数的函数 f,这个 f 称为是Hash函数。而我们希望这个函数 f 可以方便地帮我们判断两个字符串是否相等。

代码

int strHash(String ss, String b) {
        //进制 PPP 常用的值有31、131、1313、13131、131313等,用这些数值能有效避免碰撞。
        int P = 131;
        int n = ss.length(), m = b.length();
        String str = ss + b;
        int len = str.length();
        //h【i】的意义就是求区间【0~i】的字符串的哈希值
        //p【i】 是记录第i位字符的乘以P的次数-权值
        int[] h = new int[len + 10], p = new int[len + 10];
        p[0] = 1;
        //通过前缀和 h(i) 记录hash值,方便计算
        for (int i = 0; i < len; i++) {
            p[i + 1] = p[i] * P;
            h[i + 1] = h[i] * P + str.charAt(i);
        }
        int r = len, l = r - m + 1;

        // h[i]=h[i-1] * P + str.charAt(i);
        // h[i+1]=h[i-1] * P^2 + str.charAt(i) * P +str.charAt(i + 1)
        // h[i+2]=h[i-1] * P^3 + str.charAt(i) * P^2 +str.charAt(i + 1) * P + str.charAt(i + 2)

        //推论 - 相当于对字符串求hash值
        //h[r] - h[l - 1] * p[r - l + 1] = str.charAt(l - 1) * P ^ (r-l) +  str.charAt(l) * P ^ r +....+  str.charAt(r);
        int target = h[r] - h[l - 1] * p[r - l + 1]; // b 的哈希值
        //通过右移一位,减少边界条件0的判断
        for (int i = 1; i <= n; i++) {
            int j = i + m - 1;
            int cur = h[j] - h[i - 1] * p[j - i + 1]; // 子串哈希值
            //返回满足条件的开始位置 - 在a+b字符串中的位置
            if (cur == target) return i - 1;
        }
        //没有找到
        return -1;
    }

参考文档

https://www.dotcpp.com/course/964 (解析字符串哈希(Hash))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值