1. Brute Force算法
最简单的二层循环,没有什么技巧,就是依次比较。
2. KMP算法
KMP算法主要是考虑模式串本身。也就是对于模式串而言,出现不匹配时,是否可以减少移动的位数。特别是模式串的重复字符串较多时。
3. Horspool算法
是一种后缀搜索算法。
匹配串:abcbcsdxzcxx
模式串:cbcac
从右向左对比,最左边,'c'='c';第二个'b'<>'a',此时,模式串从不匹配的那个字符开始从右向左寻找匹配串中不匹配的字符b的位置,本例有,移位比较。
匹配串: abcbcsdxzcxx
模式串: cbcac
模式串继续从最右边的字符开始,从右向左进行比较
如果没有,那么直接将模式串移动到该字符的后面,如:
匹配串:abcecsdxzcxx
模式串:cbcac
从右向左对比,最左边,'c'='c';第二个'e'<>'a',此时,模式串从不匹配的那个字符开始从右向左寻找匹配串中不匹配的字符b的位置,没有找到。
匹配串:abcecsdxzcxx
模式串: cbcac
4. Boyer-Moore算法
有点Horspool+KMP的思想。
分两步:当出现错误匹配的时候,移位,基本上就是做的Horspool那一套。
当出现错误匹配的时候,我还要从不匹配点向左看,
以前匹配的那段子字符串在模式串本身中是否有重复,有重复就直接把重复的那段和匹配串中已经匹配的那一段对齐。
匹配串:abaccbabbazz
模式串:cbadcba
我们发现'c'<>'d'时,
匹配串: abaccbabbazz
模式串:cbadcba
5.Sunday算法
同Horspool一样,采用后缀查找,当出现不匹配的时候,却不是去找匹配串中不匹配的字符在模式串的位置,而是直接找最右边对齐的右一位的那个字符在模式串的位置。
匹配串:abcbczdxzc
模式串:zbcac
这里我们看到'b'<>'a',我们就看匹配串中的z在模式串的位置。
匹配串:abcbczdxzc
模式串: zbcac
如果模式串中的没有那个字符怎么办呢?
匹配串:abcbcedxzcs
模式串:zbcac
E不在模式串中出现,就直接跳过e
匹配串:abcbcedxzcs
模式串: zbcac