几个高效的字符串匹配算法

在写这篇之前,我一定要说,我讨厌KMP算法!!!所以我是不会讲解KMP算法的!!!

好了,开始。

Horspool算法

Horspool 算法的思想很简单的。创新之处是模式串是从右向左进行比较。

匹配串:abcbc sdxzcxx

模式串:cbcac

第一步:从右向左进行匹配,c-c ,第二个b-a 不匹配。

第二步:模式串从不匹配的那个字符开始,从右向左寻找匹配串中不匹配的字符b 的位置。

匹配串:abcbcsd xzcxx

模式串:    cbcac

第三步:将模式串中的b与匹配串中的b对应。

第四步:从右向左进行匹配。d-c 不匹配,且模式串中无d,移动一个模式串长度。

匹配串:abcbcsdxzcxx

模式串:             cbcac


Sunday算法

Sunday 的算法思想和Horspool 有些相似。当出现不匹配的时候,不是去找匹配串中不匹配的字符在模式串的位置,而是直接找最右边对齐的右一位的那个字符在模式串的位置。

第一步:b-a 不匹配,我们就看匹配串中的z 在模式串的位置。

匹配串:abcbc zdxzc

模式串:zbcac

第二步:

匹配串:abcbczdxzc

模式串:         zbcac

第三步:如果模式串中的没有那个字符则跳过该字符串。e 不在模式串中出现

匹配串:abcbc edxzcs

模式串:zbcac

那么:

匹配串:abcbcedxzcs

模式串:      zbcac


RK算法

把文本每m个字符构成的字符段作为一个字段,和模式进行匹配检查。如果能对一个长度为m的字符串赋以一个Hash函数。那么显然只有那些与模式具有相同hash函数值的文本中的字符串才有可能与模式匹配,没有必要去考虑文本中所有长度为m的字段,因而大大提高了串匹配的速度。

 将字符串的每一个字符看做一个数,那么这个字符串的就是一个数字数组,通过积分向量可以快速任意一个长度子字符串的向量和,可以把字符串的对应的字符数组的元素和看做这个字符串整体特征。

匹配串:aabsee sds 

模式串 :    ees
   see向量和 == ees向量和,就对see和ees做逐个字符的比较,发现不匹配继续往下走。

匹配串:aabeessds 

模式串 :    ees

   ees向量和 == ees向量和 ,就对ees和ees做逐个字符的比较,发现匹配OK。






  • 4
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值