Manacher马拉车算法
基本概念
- 添加字符#,可以解决字符串长度奇偶数问题。例如:
字符串:11311
表格第二行为,以当前字符为中心的最长回文子串长度,除以2则为在原字符串中的回文子串长度。例如:11/2=5,表示中心为3时最长回文长度为5。
# | 1 | # | 1 | # | 3 | # | 1 | # | 1 | # |
---|---|---|---|---|---|---|---|---|---|---|
1 | 3 | 5 | 3 | 1 | 11 | 1 | 3 | 5 | 3 | 1 |
- 回文半径数组:以每个字符为中心,能扩出的回文半径的长度
- 所有回文半径的回文最右边界,当前字符和之前字符能到达的最有边界。例如:012131210;当到3时,右边界到达字符串最右边的0位置,所以当3后面的字符1210,每个字符的最右边界都是最右边的0位置。
- 回文右边界的中心:最早取得回文最右边界位置的中心,此概念是与回文右边界绑定的。
字符串 | 0 | 1 | 2 | 1 | 3 | 1 | 2 | 1 | 0 |
---|---|---|---|---|---|---|---|---|---|
下标 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
最右边界(R) | 0 | 1 | 3 | 3 | 8 | 8 | 8 | 8 | 8 |
中心(C) | 0 | 1 | 2 | 2 | 4 | 4 | 4 | 4 | 4 |
以当前位置向外扩的可能性
假设当前位置为i
- i不在回文最右边界内时
选择暴力向两边扩,扩不出去则自己为最右边界。 - i在回文最右边界内时
首先通过i和C(中心),找到i的对称点i’- 如果i’ 的边界在LR边界内,则i的边界也在最右边界范围内,不用再去扩。
- 如果i’ 的左边界不在LR边界内,则i的回文半径是i到R的长度
- 如果**i’**半径压线,则需要继续向外扩
- 如果i’ 的边界在LR边界内,则i的边界也在最右边界范围内,不用再去扩。
时间复杂度O(N)
Java代码
/*
* 插入字符#
*/
public static char[] manacherString(String str) {
char[] charArr = str.toCharArray();
char[] res = new char[str.length() * 2 + 1];//扩展的数组
int index = 0;
for (int i = 0; i != res.length; i++) {
res[i] = (i & 1) == 0 ? '#' : charArr[index++];//i & 1与运算:表示i的二进制第一位的数与1的与运算,总体下来结果为:01010101···
}
return res;
}
public static int maxLcpsLength(String str) {
if (str == null || str.length() == 0) {
return 0;
}
char[] charArr = manacherString(str);//获得处理好的字符串
int[] pArr = new int[charArr.length];//存储回文半径
int C = -1;
int R = -1;
int max = Integer.MIN_VALUE;
for (int i = 0; i != charArr.length; i++) {
pArr[i] = R > i ? Math.min(pArr[2 * C - i], R - i) : 1;//划分为两个大的范围,i在内和i在外,并且不需要进行验证(即都是扩展之前的状态)
//虽然第二大类的1、2类可以直接出结果,不需要再扩,但是这里对四种情况都进行扩充,第二大类的1、2类会直接判断不能再扩
while (i + pArr[i] < charArr.length && i - pArr[i] > -1) {//判断i扩充是否越界
if (charArr[i + pArr[i]] == charArr[i - pArr[i]])//扩充比较
pArr[i]++;
else {
break;
}
}
if (i + pArr[i] > R) {
R = i + pArr[i];
C = i;
}
max = Math.max(max, pArr[i]);
}
return max - 1;
}
面试题目
要求:如果只能向字符串的最后添加字符,怎么样让字符串变为回文串,并且添加的字符数量最少。
例如:abc12321;则添加cba可以达成要求。
解法:在判断最右边界R时,当第一次R到达最右边界时(例如:中心为3时最右边界R为1,恰为字符串最右边界),则停止,并根据最右边界R中心C判断出左边界,并且将左边界前的字符串逆序添加到字符串后边。