Given a string S, find the longest palindromic substring in S. You may assume that the maximum length of S is 1000, and there exists one unique longest palindromic substring.
这两题都是给你一个字符串,求出最长回文子串。
在以前打acm的时候我是用了区间dp,每一个单一的子串就是一个回文子串。用一个数组mark[i][j]用来记录子串从i到j是否为回文子串,我们从i到j的长度进行遍历,用dp的思维,假设mark[i][j]长度为n的回文子串全部已经确定,那我们只需要确定n+1的回文子串,方程为:
if(s[j] == s[k] && mark[j + 1][k - 1] == true)
mark[j][k] = true;
这种dp的算法时间复杂度是O(n的平方),下面是leetcode的代码:
class Solution {
public:
string longestPalindrome(string s) {
int begin = 0;
int maxx = 1;
int n = s.length();
bool mark[n][n] = {false};
for(int i = 0; i < n; ++ i)
mark[i][i] = true;
for(int i = 0; i < n - 1; ++ i)
if(s[i] == s[i + 1])
{
mark[i][i + 1] = true;
maxx = 2;
begin = i;
}
for(int i = 3; i <= n; ++ i)
for(int j = 0; j < n - i + 1; ++ j)
{
int k = i + j - 1;
if(s[j] == s[k] && mark[j + 1][k - 1] == true)
{
mark[j][k] = true;
maxx = i;
begin = j;
}
}
return s.substr(begin, maxx);
}
};
然后我上网学习了一种新的时间复杂度为O(n)算法,叫manacher,也是用来解决回文子串,现在先贴poj3974的代码在分析。
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
char c[1000001];
char newc[2000005];
int p[2000005];
int len;
int num;
void makethenewstring()
{
newc[0] = '@';
newc[1] = '#';
for(int i = 0; i < len; ++ i)
{
newc[i * 2 + 2] = c[i];
newc[i * 2 + 3] = '#';
}
newc[len * 2 + 2] = '\0';
}
void manacher()
{
int maxx = 0, id, ans = 1;
len = len * 2 + 2;
for(int i = 0; i < len; ++ i)
{
if(maxx > i)
p[i] = min(maxx - i, p[2 * id - i]);
else
p[i] = 1;
while(newc[i - p[i]] == newc[i + p[i]])
p[i]++;
if(p[i] + i > maxx)
{
maxx = p[i] + i;
id = i;
}
if(ans < p[i])
ans = p[i];
}
printf("Case %d: %d\n", num, ans - 1);
}
int main()
{
num = 1;
while(cin >> c && strcmp(c, "END") != 0)
{
len = strlen(c);
makethenewstring();
manacher();
num++;
}
return 0;
}
解决回文子串,我们知道子串‘a’和‘aa’都是回文,就是说需要判断奇偶。而manacher则用了一种很巧妙的方法防止这个事情发生,在每一个原字符串中加入一个题目不会出现的字符例如‘#’
原字符串为“abbca”
则之后改为“#a#b#b#c#a#”
这样就不用判断奇偶性。现在根据上面代码提出四个主要问题:
1.数组p,maxx和id代表什么意思?
2.如何理解
if(maxx > i)
p[i] = min(maxx - i, p[2 * id - i]);
else
p[i] = 1;
3.答案为p[i]-1是怎样得到的?
4.时间复杂度为什么是O(n)?
1.数组p[i]代表以i为中心(新加字符导致奇偶性的不用判断在这里十分方便)的最大回文半径(包括i),maxx代表当前最大回文子串的最右边能够到达的位子,id为当前这个回文子串的中心
3.先回答3,所以答案应该是p[i] * 2 - 1 然后减去新添加的特殊字符p[i]个算出是p[i] - 1
2.这个算法最难懂的地方,由于manacher是从左向右遍历,假如maxx大于i,p[i]有可能是以p[j](i以id对称的点)值相等,p[j] = p[2*id-i], 也有可能是maxx-i小于p[j],此时p[i]就是maxx-i;
否则,直接假设p[i]=1,其实p[i]不是最终的值,需要下一步算法把p[i]增大,至于问题4也是从这里解决,我也表达不清楚理解不太好,问题2和4可以百度一下其他大神的博客做更好的理解(这里并没有上图23333)。