回文字符串
回文串就是从前往后读和从后往前读完全一致的字符串:
1.字符串:abbababa 最长回文子串:5(abbababa)
2.字符串:abcbbabbc 最长回文子串:7(abcbbabbc)
3.字符串:abccbaba 最长回文子串:6(abccbaba)
暴力法
暴力解法,就是从字符串的每一个位置开始,每次向两边扩展,算法复杂度为O(n2),同时每一个位置还要考虑回文串是偶数串,还是奇数串。
Manacher
启发
通常情况下,如果我们能够将前面扫描的结果保存下来,那么我们就有可能将算法复杂度降低,这也是动态规划(记忆化搜索)的核心思想
他来了
manacher 算法基本是有以下步骤
字符串扩充
将字符串长度统一为奇数,在开头结尾和中间插入一个不会在原字符串出现的字符,例如
abcdcb–>
#a#b#c#d#c#b#–>这样总长度就变为 (2*n+1)
你以为就这样了吗
你要永远记得,天下没有免费的午餐,你想降低时间复杂度,那么就要牺牲空间复杂度,你需要一个记忆数组,p[2*n+1],他记录所有的回文子串的延伸范围,
s[] == # a # b # c # d # c # b #
p[] == 1,2,1,2,1,2,1,4,1,2,1,2,1
注意观察 p[]数组,我们只需要p[]数组为偶数的(奇数只会出现在特殊字符)
p[i]-1表示原回文子串的长度,p[i]/2表示回文原始延伸范围
这里还需要一个概念:字符 0~i所能向右延伸的最远下标 mx(其实不包含mx下标),mx = max(p[i]+i)
对称里的对称是一致的
这个概念需要理解,我们举个例子:
a b a d a b a c d f, 注意到 a b a d a b a,是关于“d”(s[3])对称的,也就是那么 s[5]关于s[3]的对称点为s[1],那么 以s[5]的回文子串和以s[1]相同的;
势力范围加快速度
Manacher讲解经典图,这里就是加快算法的原理,假设我们已经扫描了0-i-1的字符,同时更新了p[0]-p[i-1],还要mx,以及mx对应的 id,分为两种情况:
(1)如果,i>=mx,那么只能更新p[i]=1;
(2)如果,i<mx,这个时候就落在了id的控制范围内了,同时也分为两个子情景:
(1)如果,p[j]<=mx-i利用“对称里的对称是一致的”,则有 p[i] = p[j],(j = 2id-1)
(2)但是,如果 p[j]>mx-i,那么只能取 mx-i了
综合 p[i] = min(p[2id-1],mx-i);
代码实现
//扩充字符串
string Expan(string str)
{
int size = str.size();
string expanStr('#');
for(int i=0;i<size;i++)
{
expanStr.push_back(str[i]);
expanStr.push_back('#');
}
return expanStr;
}
int Manacher(string str,int n)
{
int mx=0,pos = 0,p[2*n+1],pMax = 0,indexMax =0;//存储半径
if(str.size()>0)
{
string exstr = Expan(str);
for(int i=0;i<2*n+1;i++)
{
//区间判断(完全包含)
if(i<mx)
{
//找最大mx
p[i] = min(mx-pos,p[2*(mx-pos)-i]);//至少有这么大
}
else
p[i] = 1;
//再次暴力都需要,从i开始
while((i-p[i]>=0)&&(i+p[i])<2*n+1)//保证左右边界
{
if(exstr[i-p[i]]==exstr[i+p[i]])
{
p[i]++;
}
else
break;
}
//更新mx和pos
if(p[i]+i>mx)
{
pos = i;
mx = p[i]+i;
}
if(p[i]>pMax)
{
pMax = p[i];//最长长度
indexMax = i;//最长的索引位置
}
}
}
return pMax;
}
使用Manacher找到最长回文串
注意到,对于扩展后的字符串,有以下特点:
(1)当exstr[i]不是‘#’的时候, p[i]一定是偶数;否则p[i]一定是奇数;
(2)对于扩展字符串的每个位置对应的p[i],那么对应的原始的回文串的长度为p[i]-1;(奇偶就对应上了,以正常字符为中心的回文串长度一定是奇数,以特殊字符串为中心的回文串一定是偶数)
(3)对与扩展后的位置i和对应的p[i]—>[i-p[i]+1,i+p[i]-1],对应的原始字符串的回文串为[(i-p[i])/2,(i+p[i]-2)/2],也就扩展后的下标为i,那么原始下标为(i-1)/2,因为原始长度为n,变换后的长度2*n+1;