"因祸得福" ---字符串交迭和边界问题的继续回顾-CSDN博客

昨天那个border算法我说好像在哪里见过，原来就是KMP算法中的精髓部分。KMP算法我以前是看过的，现在足以表明我看的是多么肤潜，或者说根本就没弄懂他的意思。以前对KMP算法的next[]函数引入是佩服的五体投地，四脚朝天，但对next[]函数并没有更深入的了解，想起昨天从字符串的边界问题引出了KMP算法，现在方知，KMP算法归根到底也是字符串的交迭和边界问题啊。岂非因祸得福！

关于KMP算法，网上有一篇绝妙的文章，个人认为是介绍的最通俗易懂的了。作者是A_B_C_ABC，原文地址：http://blog.csdn.net/A_B_C_ABC/archive/2005/11/25/536925.aspx 。看看里面串的模式值next[n]的定义：

（1）next[0]= -1 意义：任何串的第一个字符的模式值规定为-1。

（2）next[j]= -1 意义：模式串T中下标为j的字符，如果与首字符

相同，且j的前面的1—k个字符与开头的1—k

个字符不等（或者相等但T[k]==T[j]）（1≤k<j）。

如：T=”abCabCad” 则 next[6]=-1，因T[3]=T[6]

（3）next[j]=k 意义：模式串T中下标为j的字符，如果j的前面k个

字符与开头的k个字符相等，且T[j] != T[k] （1≤k<j）。

即T[0]T[1]T[2]。。。T[k-1]==T[j-k]T[j-k+1]T[j-k+2]…T[j-1]

且T[j] != T[k].（1≤k<j）;

(4) next[j]=0 意义：除（1）（2）（3）的其他情况。

对比border(x)的定义：

计算长度为m的一个字符串x的边界的长度，设定一个包含m+1个整数的数组b,使得b[j]是字符串x[0,1...j-1]的边界的长度。特别的，border(x)的长度就是b[m]，这里规定b[0]=-1。

border的复杂就体现在它把这么多话就压成这么二句话了，当然原文作者也根本就没提到KMP算法。至此大体解决了昨天的疑惑。

举个例子实战一下：给定字符串 x = abaababa,打印出数组b。

//border算法的一个应用
public class Border() {
       public void Border(String x,char [] y) {
           int m = x.length();
           int [] b = new int[x.length()+1];
           int i = 0;
           b[0] = -1;

           for(int j = 1;j <= m-1; j++) {
                  b[j] = i;
                  while( i >= 0 && y[j] != y[i]) {
                         i = b[i];
                   }
                   i++;
           }
            b[m] = i;    //border算法
            for(int k = 0;k < m+1; k++) {
                    System.out.println(b[k] + "  ");
            }
       }

        public static void main(String[] args) {
              Border border = new Border();
              char []X = {'a','b','a','a','b','a','b','a'};
              String str = new String(X);
              border.Border(str,X);   
        }
}

在C++中可以只用到String s = "abaababa"，不知道这里可以一步到位吗？

分析结果，其实可以看出来 border(x)=3,因为有 abaababa abaababa。

当m = 0时 b[0] = -1

当m = 1时依据border算法 b[1] = 0

....

最后结果应为:其中border(x) = b[m] = b[8] = 3。

-1

运行结果和预测一致,如图：问题over！