算法(第4版)学习笔记

1、概要

 

 

 2、字符串

2.1 Rabin-Karp算法

关键思想是对于位置i,高效计算文本中i+1位置的子字符串散列值。文本txt中起始于位置i的含有M个字符的子字符串所对应的数为:

        x_i=t_iR^{M - 1} + t_{i+1}R^{M-2}+\cdots+t_{i+M-1}R^0

假设已知h(x_i)=x_i \bmod Q,则i+1位置开始,长度为M的子字符串所对应的数为:

        x_{i+1}=\left(x_i - t_iR^{M-1}\right )R + t_{i+M}

在基于蒙特卡洛法,针对Q选取较大的质数。散列值一样时,就认为是字符串匹配。

而基于拉斯维加斯算法时,在散列值一样时,还需要比较字符串是否一致。

https://github.com/wuli2496/material/blob/master/%E7%AE%97%E6%B3%95%E7%AC%AC4%E7%89%88/%E7%AC%AC5%E7%AB%A0/RabinKarp.java

2.2 KMP算法

关键是构造dfa。dfa(c,j)表示模式的第j个位置的字符与字符c比较时,继续下一个字符匹配的位置。如果模式第j个位置的字符等于c,则下一个字符匹配的位置就是j+1。对于第个j

  • 匹配失败时,将 dfa[][x]复制到dfa[][j]
  • 匹配成功将dfa[pat.charAt(j)][j] =j+1
  • 更新x

ABABAC的状态转换图为

https://github.com/wuli2496/material/blob/master/%E7%AE%97%E6%B3%95%E7%AC%AC4%E7%89%88/%E7%AC%AC5%E7%AB%A0/KMP.java

参考资料:

https://algs4.cs.princeton.edu/home/

https://algs4.cs.princeton.edu/code/

https://github.com/kevin-wayne/algs4

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kgduu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值