sunday
sunday算法是1990年提出的字符串模式匹配。相对于比较KMP和BM算法而言,简单许多。原理与BM算法相仿,有点像其删减版,所以其时间复杂度和BM算法差不多,平均性能的时间复杂度也为O(n),最差情况的时间复杂度为O(n * m),但是要容易理解。
匹配原理:从前往后匹配,如果遇到不匹配情况判断母串S参与匹配的最后一位的下一位字符,如果该字符出现在模板串T中,选择最右出现的位置进 行对齐;否则直接跳过该匹配区域。原理看着都这么繁琐,而且难懂,还是给读者上图吧:
母串S:
S E A R C H S U B S T R I N G
模板串T:
S U B S T R I N G
开始匹配:
S E A R C H S U B S T R I N G
↨
S U B S T R I N G
继续下一字符匹配:
S E A R C H S U B S T R I N G
↨
S U B S T R I N G
出现不匹配情况,查找母串参与匹配的最后一位字符的下一字符,上图中S中最后一位参与
匹配的字符是颜色为蓝色的字符’B’,其下一字符为’S’,在T中,字符’S’出现两次,按照原理,
选择最右位置出现的’S’进行对齐,那么可以得到:
S E A R C H S U B S T R I N G
↨
S U B S T R I N G
直接跳过大片区域。
假设母串S为:
S E A R C H S U B Z T R I N G
那么当匹配到上述情况时,字符’Z’在T中没有出现,那么就可以得到下面的情况:
S E A R C H S U B Z T R I N G
↨
S U B S T R I N G