最长重复子串是指在字符串中中找出两个子串(可以覆盖),他们的公共前缀最长;所以可以采用后缀数组的解法,首先得到所有后缀数组并排序,然后找出所有相邻两个子串之间的最长前缀;由于字符串比较的时间复杂度是O(N),排序算法的时间复杂度是O(NlogN);所以该算法的时间复杂度是O(N*N*logN)
代码如下:
import java.util.Arrays;
public class LongestRepSubSequence {
public static void main(String[] args) {
// TODO Auto-generated method stub
longestRepSubSequence("abcdabcdef");
}
public static void longestRepSubSequence(String str){
String[] strArray = new String[str.length()];
for(int i = 0; i < str.length(); i++){
strArray[i] = str.substring(i);
}
Arrays.sort(strArray);
int maxCommonLen = 0;
String maxCommonStr = new String();
for(int i = 0; i < strArray.length-1; i++){
int len = 0;
for(int j = 0; j < strArray[i].length() && j < strArray[i+1].length(); j++){
if(strArray[i].charAt(j) == strArray[i+1].charAt(j))
len++;
else
break;
}
if(len > maxCommonLen){
maxCommonLen = len;
maxCommonStr = strArray[i].substring(0, len);
}
}
System.out.println("Max Common Length: " + maxCommonLen);
System.out.println("Max Common Sequence: " + maxCommonStr);
}
}
第二种解法是采用动态规划的解法,创建一个二维数组t,假如字符串s的i和j位置的字符相等,则:t[i][j] = t[i-1][j-1] + 1(当i-1 >= 0 && j-1 >= 0时);当i为0或者j为0,且s[i] == s[j],则t[i][j] = 1;当s[i] 与s[j]不相等,则t[i][j] = 0;动态规划的时间复杂度是O(N*N);代码此处省略