BM算法
坏字符原则:
示例:
76543210
GCAGCGAG
坏字符(Bad Char):多次重复的字符在子串中最后出现的位置
bmBc【i】:
GCAT
1328
T为文本中出现的字符但是模式串中不包含的字符
好后缀原则:
好后缀(Good Suffix):到与当前匹配的后缀相同但是与当前失配字符不同的位置的距离
bmGs【i】:
7 6 5 4 3 2 1 0
G C A G C G A G
7 7 7 7 7 4 2 1
就倒数第二个G来说,BM算法从后往前匹配,所以当前匹配到10的AG状态匹配,但是2号的G与待匹配串失配,所以从当前位置往前找具有相同后缀(AG)但是与当前字符不同的字符,可以看到位于6的C后缀有AG匹配,且字符为C不同于当前匹配字符G,所以bmGs【2】 = 6-2 = 4。