LeetCode | Rabin-Karp 算法

字符串匹配(查重)问题

Rabin-Karp 算法是用来解决字符串匹配(查重)的问题的。
这个问题表达如下:

  • Input : 字符串p,和字符串q
  • Output:如果p中包含q,则输出True;如果p中不包含q,则输出False

时间复杂度:O(m+n)

1. 常规Brute Forch算法(暴力解法)

  1. 假设字符串p的长度为m,字符串q的长度为n
  2. 在字符串p上放一个长度为n的窗口,缓慢滑动这个窗口,每滑动一次就与字符串q比较一次
  3. 当比较结果一致时返回True,若直到最后依然不一致,则返回False

分析:

  1. 最坏情况下,窗口滑动至末尾,一共有(n-m+1)次滑动。-- O(m)
  2. 每次滑动字符串都得进行比较。-- O(n)
  3. 综上,时间复杂度为O(m*n)

2. 关于字符串的比较以及hashing字符串

  1. 如果想要比较两个字符串是否相同,需要依次比较每个位置对应的字符是否相同,则时间复杂度为O(n)

  2. 如果我们将字符串以一个特定的函数H(·),将字符串转换成一个数字,那么我们只需要比较两个字符串的哈希值,就能够判断它们是否相同,时间复杂度为O(1)

  3. Hashing字符串一般用到如下公式:在这里插入图片描述
    其中,\alpha 代表的是S的定义域大小,比如说如果S全是英文字母,那么的值为26,因为英文字母就只有26个。
    然后这个函数是一个映射函数,映射S的定义域中的每一个字符到数字的函数。

3. Rabin-Karp算法流程

  1. 基本思想与暴力解法一致,但比较的是两个字符串的哈希值

  2. 由于哈希值为数字,因此比较的时间复杂度为O(1)

  3. 比较两个字符串的哈希值前需要先进行计算。若字符串q长度为n,则计算q的哈希值的时间为O(n)。接下来,就是这个算法的神奇之处了:

    1)首先我们看一下字符串哈希值的计算公式:
    在这里插入图片描述
    2) 若我们已经知道上一个窗口的哈希值时,则我们可以在此基础之上计算当前窗口的哈希值(减法-乘法-加法),原理如下:
    在这里插入图片描述
    3)因此,在已知上一个窗口的哈希值时,计算当前窗口的哈希值的时间复杂度为O(1)

  4. 重新计算一次时间复杂度:
    时间复杂度 = 窗口滑动的最坏情况x字符串比较时间+哈希值的计算时间=m+n

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值