字符串哈希算法

字符串哈希算法

该算法的目的是将字符串转化为哈希值,这样的话在做字符串匹配的题的时候可以大大降低时间复杂度,仅需O(1)的时间复杂度即可。

首先要设一个P值,为每次进位所相乘的数,即将字符串看成一个P进制的数。一般设为13331。

同时我们需要设两个数组h[n+1],p[n+1]。其中h用来存储算出的字符串的哈希值,p用来存储这是第几次进位。初始化p[0]=1,h[0]=0。

因此我们可以计算一个字符串s的中每个以0开始,i结尾的子字符串的哈希值
如字符串a=“abcde”,b=“abcdefgh”;其中a的哈希值为1234,b的哈希值为1234567
则"fgh"的哈希值为1234567-1234*10^(7-5+1)=567

long[] h, p;
int P = 1313131, n = s.length();
h = new long[n+1]; p = new long[n+1];
p[0] = 1;
for (int i = 0; i < n; i++) {
    p[i + 1] = p[i] * P;
    h[i + 1] = h[i] * P + s.charAt(i);
}

因此我们如果需要计算字符串s的子字符串的哈希值时,只需要知道其开始位置i和结束位置j,利用前缀和的思想(h[n]数组表示的正是前n个字符串的哈希值)

long cur=h[j+1]-h[i]*p[j-i+1]

例题:leetcode 1044

在这里插入图片描述

class Solution {
    long[] h, p;
    public String longestDupSubstring(String s) {
        int P = 1313131, n = s.length();
        h = new long[n+1]; p = new long[n+1];
        p[0] = 1;
        for (int i = 0; i < n; i++) {
            p[i + 1] = p[i] * P;
            h[i + 1] = h[i] * P + s.charAt(i);
        }
        String ans = "";
        int l = 1, r = n-1;
        while (l <=r) {
            int mid = l+(r-l)/2;
            String t = check(s, mid);
            if (t.length() != 0) l = mid+1;
            else r = mid - 1;
            ans = t.length() > ans.length() ? t : ans;
        }
        return ans;
    }
    String check(String s, int len) {
        int n = s.length();
        Set<Long> set = new HashSet<>();
        for (int i = 0; i<n-len+1; i++) {
            int j = i + len - 1;
            long cur = h[j+1] - h[i] * p[j - i + 1];
            if (set.contains(cur)) return s.substring(i, j+1);
            set.add(cur);
        }
        return "";
    }
}
字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用字符串哈希算法来加速字符串的比较操作。 引用\[1\]中的代码示例展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。其中,哈希值的计算使用了前缀和数组和幂运算。 引用\[2\]中的解释指出,使用字符串哈希的目的是为了比较字符串时不直接比较字符串本身,而是比较它们对应映射的数字。这样可以将子串的哈希值的时间复杂度降低到O(1),从而节省时间。 引用\[3\]中的代码示例也展示了一个使用字符串哈希算法的C++代码。该代码使用了前缀和数组和字符串数组来存储字符串,并通过计算哈希值来比较两个子串是否相等。与引用\[1\]中的代码类似,哈希值的计算也使用了前缀和数组和幂运算。 综上所述,字符串哈希算法是一种将字符串映射为数字的算法,常用于字符串的比较和匹配。在C++中,可以使用前缀和数组和幂运算来计算字符串哈希值,并通过比较哈希值来判断两个子串是否相等。 #### 引用[.reference_title] - *1* [C++算法题 # 33 字符串哈希](https://blog.csdn.net/weixin_44536804/article/details/123425533)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [字符串哈希(c++)](https://blog.csdn.net/qq_41829492/article/details/120980055)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [AcWing 841. 字符串哈希(C++算法)](https://blog.csdn.net/YSA__/article/details/108453403)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值