Hash字符串匹配

hash字符串匹配即把固定长度的字符串转化为hash值进行匹配,这种匹配方式在大量数据的情况下是有误差的,大约万分之四五左右,这是因为hash值是通过字符和公式计算出来的,不同的字符串有可能根据我们的计算公式算出相同的hash值,这就会导致匹配的误差。

一、普通Hash匹配

普通hash匹配即每次截取模式串长度的字串计算hash值,然后原模式串的hash值进行比较,两者相同则认为匹配成功。

普通hash匹配会频繁计算原串的字串的hash值,如果原串长度为n,模式串长度为m,则原串需要计算hash值的字串数量为n-m,这n-m个hash值计算后再跟模式串hash值进行比较。

计算hash值的方法

static final int seed = 31;
static long hash(String s) {
        long hash = 0L;
        for(int i=0;i<s.length();i++) {
            hash = hash * seed + s.charAt(i);//一般的线性计算方法
        }
        return hash%Long.MAX_VALUE;//防止溢出long
}

匹配方法

    static void matches(String org,String sub) {
        long hash_sub = hash(sub);
        int sub_len = sub.length();
        for(int i&#
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C++中使用hash算法实现字符串匹配,可以采用Rabin-Karp算法。 该算法的基本思想是:将模式串和文本串都看作是一个进制为d的数,通过哈希函数将它们映射为一个整数。由于哈希函数的映射是唯一的,因此只要哈希值相等,就说明模式串和文本串可能相等。因此在比较之前,先比较它们的哈希值,若相等则说明它们可能相等,再逐个比较字符。 具体实现如下: ```c++ #include <iostream> #include <string> using namespace std; const int BASE = 131; // 哈希函数的基数 const int MOD = 1e9 + 7; // 哈希函数的模数 int Hash(string s) // 哈希函数 { int res = 0; for (int i = 0; i < s.length(); i++) { res = ((long long)res * BASE + s[i]) % MOD; } return res; } int main() { string text, pattern; cin >> text >> pattern; int patternHash = Hash(pattern); // 计算模式串的哈希值 int textHash = 0; int t = 1; for (int i = 0; i < pattern.length(); i++) { textHash = ((long long)textHash * BASE + text[i]) % MOD; // 计算初始文本串的哈希值 t = ((long long)t * BASE) % MOD; } for (int i = 0; i + pattern.length() <= text.length(); i++) { if (textHash == patternHash && text.substr(i, pattern.length()) == pattern) { cout << "Pattern found at index " << i << endl; } if (i + pattern.length() < text.length()) { textHash = ((long long)textHash * BASE - (long long)text[i] * t % MOD + MOD) % MOD; // 更新文本串的哈希值 textHash = ((long long)textHash + text[i + pattern.length()]) % MOD; } } return 0; } ``` 该算法的时间复杂度为O(n+m),其中n为文本串的长度,m为模式串的长度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值