总结:
KMP算法并不是效率最高的算法,实际采用并不多。各种文本编辑器的”查找”功能(Ctrl+F),大多采用Boyer-Moore算法。
假定字符串为”HERE IS A SIMPLE EXAMPLE”,搜索词为”EXAMPLE”
E X A M P L E
0 1 2 3 4 5 6
坏字符规则:
移动位置 = 坏字符位置 - 搜索词中的上一次出现位置
7 = EXAMPLE最后一个字符E(6) - EXAMPLE中未找到S(-1)
好字符规则:
移动位置 = 好后缀字符位置(好后缀:匹配字符串中最后一个字符)- 搜索词中的上一次出现位置
5 = MPLE中E位置(6)-EXAMPL中的E(1)
文章详解(http://www.ruanyifeng.com/blog/2013/05/boyer-moore_string_search_algorithm.html)
主要理解:坏字符规则、好字符规则 移动位置
字符串:1 2 3 4 1 2 3 3 4 5 1 2 3
搜索词:7 5 3 4 5
下标: 0 1 2 3 4
1 2 3 4 1 2 3 3 4 5 1 2 3
7 5 3 4 5
坏字符规则:
1和5不匹配,1和搜索词未匹配.
移动位置 = 坏字符位置 - 搜索词中的上一次出现位置(1上次出现位置,如果不存在则为-1)
5 = 4 - (-1)
1 2 3 4 1 2 3 3 4 5 1 2 3
7 5 3 4 5
5、5匹配
4、4匹配
3、3匹配
3、5不匹配
如果按 坏字符规则:
处理移动位置:2 = 1 - (-1)
1 2 3 4 1 2 3 3 4 5 1 2 3
7 5 3 4 5
但这里可以用 好字符规则:
移动位置 = 好后缀字符位置(好后缀:匹配字符串中最后一个字符)- 搜索词中的上一次出现位置(5上次出现位置,如果不存在则为-1)
处理移动位置:3 = 4 - 1
1 2 3 4 1 2 3 3 4 5 1 2 3
7 5 3 4 5