Horspool(字符串匹配)算法

Horsepool算法是Boyer-Moore算法的简化版本,这也是一个空间换时间的典型例子。算法把模式P和文本T的开头字符对齐,从模式的最后一个字符开始比较,如果尝试比较失败了,它把模式向后移。每次尝试过程中比较是从右到左的。

假设文本中,对齐模式最后一个字符的元素是c,Horspool算法根据c的不同情况来确定移动距离,无论c是否和模式的最后一个字符相匹配。

一般来说,会存在下面四种情况。

这里写图片描述

情况1:看第一行,模式中不存在c(此时c就是字母A),模式的移动长度就是它的全部长度,移到第二行所示的位置。

情况2:看第二行,c(此时c就是字符O)正好是模式的最后一个字符,但是从右向左比较时,有字符不匹配,比如此时的AE不匹配。而且模式中的其他m-1个字符也不包含c。移动的情况类似情况1,移动的幅度等于模式的全部长度,移到第三行所示的位置。

这里写图片描述
情况3:看第一行,模式中存在c(此时c就是字符L),但是它不是模式的最后一个字符,移动时应该把模式中最右边的c和文本中的c对齐,移到第二行所示的位置。
情况4:看第二行,c(此时c就是字符O)正好是模式的最后一个字符,但是从右向左比较时,有字符不匹配,比如此时的AE不匹配。而此时模式中的其他m-1个字符包含c。移动的情况类似情况3,移动时应该把前m-1个字符中最右边的c和文本中的c对齐,移到第三行所示的位置。



这说明,比起蛮力算法每次总是移动一个位置,从右到左的字符比较使模式模式移动得更远。然而,如果在每次尝试时都必须检查模式中的每个字符,它的优势也会丧失殆尽。我们可以预先算出遇到某个字符要移动的距离,并把它存在一个表中。具体来说,对于每一个字符c,可以通过以下公式算出移动距离:

t(c)={
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值