ACBM 算法又称为CW算法,其思想是结合和AC算法和BM技术,AC算法的思想已经在前一篇讲过了,这里想谈谈BM技术的特点。回忆下,单模式匹配算法,它可以分成两类:
1. 模式串从左向右匹配(e.g. KMP)
2. 模式串从右向左匹配(e.g. Booyer Moore)
BM算法的特点是: 最好情况下算法时间复杂度是(O(m/n)), m是字符串长度,n是pattern长度。
在一般的应用中BM算法被认为是最快的,可以称为亚线性的算法,和KMP相似的地方是,一般pattern和text失配,不移动text指针,而是pattern右移,重新开始匹配。不通之处是,算法从模式右向左移动,因此如果在失配情况下,如果pattern中没有text中的那个字符,也可以右移。前一种情况称为good-suffix shift,后者称为bad-character 。如图: