Manacher算法用于查找字符串中最长的回文字符串,一般的查找最长的回文字符串需要分开考虑回文字符串的长度为奇数还是为偶数,然而用manacher算法不需要考虑这些,全都转为奇数来计算
首先把可能的为奇数或偶数的回文字串都转为奇数
例如:“abba”的两边插入字符“#”变成“#a#b#b#a#”,“aba”两边插入“#”变成“#a#b#a#”
为了更好的处理边界问题,我们选择在字符串开始的位置插入一个特殊符号“$”
以字符串12212321为例
p[i]是记录以字符s[i]为中心的最长回文字符串的向左或向右的长度(包含s[i])
S[i]: $ # 1# 2 # 2 # 1 # 2# 3 # 2 # 1 #
P[i]: 1 2 1 2 5 2 1 4 1 2 1 6 1 2 1 2 1
由上可以看出max(p[i]-1)就是原字符串中最长会问字符串的长度。
这里引入两个辅助变量id和mx,id表示最大回文字符串中心的位置,mx表示回文字符串向右的边界,
mx = id + p[id]
接下来怎样计算p[i]?
首先令j = 2*id - i,也就是j是i关于id的对称点,如下图:
这里有两种情况:
1)mx-i>p[j],也就是说以s[j]为中心字符的回文字符串被包含在以s[id]为中心的回文字符串里边,由对称性可知以s[i]为中心的回文字符串同样包含在以s[id]为中心的回文字符串里边,所以:
p[i] = p[j]
2)mx-i<= p[i] 这时以s[j]为中心字符的回文字符串已经超出以s[id]为中心的回文字符串的边界,这是以p[i]为中心的回文字符串向右会扩展到mx的位置,并且边界会超出mx,这时根据s[id]的长度p[id]只能判断出有部分对称,超出mx的部分不能判断,只有在继续相关的匹配了,如图;
图中绿色框出来的部分就是可以判断出来的部分,因此:
p[i] = mx - i
所以,p[i] = min(p[2*id-i], mx-i)
对于超出mx的部分,则用下边代码来进行判断
while (str[i+p[i]] == str[i-p[i]] && i+p[i] < str.size()) {
p[i]++;
}
最终代码实现:
#include <iostream>
#include <cstring>
#include <string>
using namespace std;
void manacher(string& str) {
int *p = new int[str.size()+1];
memset(p, 0, sizeof(p));
int mx = 0;
int id = 0;
for (int i = 0; i < str.size(); i++) {
if (mx > i) {
p[i] = (p[2*id-i] >= mx-i? mx-i : p[2*id-i]);
} else {
p[i] = 1;
}
while (str[i+p[i]] == str[i-p[i]] && i+p[i] < str.size()) {
p[i]++;
}
if (i+p[i] > mx) {
mx = i+p[i];
id = i;
}
}
int max = 0;
int counti;
for (int i = 0; i < str.size(); i++) {
if (p[i] > max) {
max = p[i];
counti = i;
}
}
max--;
cout << max << endl;
for (int i = counti-max; i <=counti+max; i++) {
if (str[i] != '#') {
cout << str[i];
}
}
cout << endl;
delete p;
}
int main() {
string str;
cin >> str;
string str1;
str1 += '$';
str1 += '#';
for (int i = 0; i < str.size(); i++) {
str1+=str[i];
str1+='#';
}
//cout << str1 << endl;
manacher(str1);
return 0;
}