问题
对给定的字符串,本题要求你输出最长对称子串的长度。例如,给定Is PAT&TAP symmetric?
,最长对称子串为s PAT&TAP s
,于是你应该输出11。
输入格式:
输入在一行中给出长度不超过1000的非空字符串。
输出格式:
在一行中输出最长对称子串的长度。
输入样例:
Is PAT&TAP symmetric?
输出样例:
11
解析
Manacher算法可以用线性的时间复杂度解决上述问题,思想是基于对称解决问题。
首先,设置len数组用来保存每个位置最大回文子串的长度(实际上最终len数组保存的长度不一定正确,但是能保证结果正确)。对于每个新位置i,通过len[0]~len[i-1]计算len[i].
保存的max_pos和max_len说明目前从max_pos-max_len~max_pos+max_len的位置是回文的。如果当前位置i不在回文串里面,就盲目扩展即可。如果在回文串里面,则考虑其在串内的对称位置sym_pos.如果以sym_pos为中心的最大回文子串完全被max_pos的回文子串包括,而且没有达到边界,说明以i为中心的最大回文串也只能是这么长。反之,如果以sym_pos为中心的最大回文子串已经达到边界或者超过边界,说明有扩展的可能。此时不用从中心扩展,可以从max_pos对应的回文串的边界位置扩展:因为以i为中心的回文串包含在当前最大回文串内部的部分是完全回文的,所以可以从边界开始扩展。
最后,源程序中通过添加字符#的方式保证最后的回文串是奇数长度,避免偶数长度回文子串没有中心。
代码
#include <iostream>
#include <string>
#include <cstring>
#include <algorithm>
#include <stack>
#include <queue>
#include <vector>
#include <cmath>
#include <cstdio>
#include <bitset>
using namespace std;
const int N = 2000 + 5;
// 题目来源:https://pintia.cn/problem-sets/994805046380707840/problems/994805067704549376
// 参考:https://baike.baidu.com/item/Manachar%E7%AE%97%E6%B3%95/20415813
int raw_expand(char* str, int mid, int begin){
// 中心为mid时,str中最大回文串, 从中心到最右的距离。
// begin指的是,从mid-begin到mid+begin都已经配对了,返回的距离至少是begin
begin++;
while(mid-begin>=0 && mid+begin<strlen(str) && str[mid-begin]==str[mid+begin])
begin++;
return begin-1;
}
int Manacher(char* str){
// 填充为奇数长度,例如str = 10填充为new_str = 21
char new_str[N];
for(int i=strlen(str); i>=0; i--){
// 这样写有越界的危险,因为copy了str末尾的\0。但是其实没问题。
new_str[2*i+1] = str[i];
new_str[2*i] = '#';
}
// test
// cout << new_str << endl;
// 计算长度
int len[N];
// len[i]: 在新串中,以第i个字符为中心的回文串,从中心到最右的距离,只算扩展长度。
// 例如a#b#c,b处的len为1,说明以b为中心,pos_b-1~pos_b+1是回文串
int max_len = 0, max_pos = 0; // 当前最大的len元素和取得位置
for(int i=1; i<strlen(new_str); i++){
if(i < max_len + max_pos){ // i在当前最长回文串里面
int sym_pos = 2* max_pos - i; // i在当前最长回文串里面的对称位置
if(sym_pos - len[sym_pos] < max_pos - max_len){
// sym_pos的最大子串被当前最大子串完全包含,而且没有扩展可能
len[i] = len[sym_pos]; // 对称,i的最大子串被当前最大子串完全包含,所以是可以确定的
}
else{
// 此时有 i + len[i] >= max_pos + max_len,直接从begin = max_pos + max_len - i开始
len[i] = raw_expand(new_str, i, max_pos + max_len - i);
}
}
else{
// 没有信息,直接判断
len[i] = raw_expand(new_str, i, 0);
}
// 最后更新max
if(len[i] > max_len){
max_len = len[i];
max_pos = i;
}
}
// test
/*
for(int i=0; i<strlen(new_str); i++){
cout << len[i] << " ";
}
cout << endl;
*/
// output
return max_len;
}
int main(){
char str[N];
cin.get(str, N);
cout << Manacher(str);
return 0;
}
给出一个朴素O(n^2)做法加以对比:
#include <iostream>
#include <string>
#include <cstring>
#include <algorithm>
#include <stack>
#include <queue>
#include <vector>
#include <cmath>
#include <cstdio>
#include <bitset>
using namespace std;
const int N = 2000 + 5;
// 题目来源:https://pintia.cn/problem-sets/994805046380707840/problems/994805067704549376
int raw_expand(char* str, int mid, int begin){
// 中心为mid时,str中最大回文串, 从中心到最右的距离。
// begin指的是,从mid-begin到mid+begin都已经配对了,返回的距离至少是begin
begin++;
while(mid-begin>=0 && mid+begin<strlen(str) && str[mid-begin]==str[mid+begin])
begin++;
return begin-1;
}
int longest(char* str){
// 填充为奇数长度,例如str = 10填充为new_str = 21
char new_str[N];
for(int i=strlen(str); i>=0; i--){
// 这样写有越界的危险,因为copy了str末尾的\0。但是其实没问题。
new_str[2*i+1] = str[i];
new_str[2*i] = '#';
}
// 计算长度
int len[N];
// len[i]: 在新串中,以第i个字符为中心的回文串,从中心到最右的距离,只算扩展长度。
// 例如a#b#c,b处的len为1,说明以b为中心,pos_b-1~pos_b+1是回文串
int max_len = 0, max_pos = 0; // 当前最大的len元素和取得位置
for(int i=1; i<strlen(new_str); i++){
// 没有信息,直接判断
len[i] = raw_expand(new_str, i, 0);
//最后更新max
if(len[i] > max_len){
max_len = len[i];
max_pos = i;
}
}
// output
return max_len;
}
int main(){
char str[N];
cin.get(str, N);
cout << longest(str);
return 0;
}
练习:LeetCode 5
- Longest Palindromic Substring
Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.
Example 1:
Input: “babad”
Output: “bab”
Note: “aba” is also a valid answer.
Example 2:
Input: “cbbd”
Output: “bb”
在这里就不放代码了,两道题基本上是一样的。