在一个大的字符串S中查找字符串T,naive的算法时间复杂度为O(s * t)(这里s与t代表S的长度与T的长度);而应用KMP,时间复杂度为O(s + t)。
KMP算法的核心在于next数组。next数组只与字符串T有关,与S无关。
next数组的核心思想是存储字符串T的内容的相似性信息,具体而言:
next数组记录了T的每一个前缀子串M(m>=2)中,(M的)相等的前缀真子串与后缀真子串的最大长度。换句话说,就是M的首部和M的尾部最多有多少个字母完全相同。
举个例子,若T = agctagcagctagctg,求其next数组。