【超好懂的字符串算法笔记】Manacher(马拉车)算法——找最长回文子串问题

最新推荐文章于 2024-10-01 23:05:47 发布

RWLinno

最新推荐文章于 2024-10-01 23:05:47 发布

阅读量163

点赞数

分类专栏： ACM 字符串文章标签：算法 acm竞赛程序设计字符串 c++

本文链接：https://blog.csdn.net/SC_Linno/article/details/121234701

版权

ACM 同时被 2 个专栏收录

117 篇文章 9 订阅

订阅专栏

字符串

6 篇文章 0 订阅

订阅专栏

title : Manacher(马拉车)
date : 2021-11-8
tags : ACM,字符串
author : Linno

在这里插入图片描述

问题描述

$给定一个长度为 n 的字符串 s ，请找到所有对 (i, j) 使得子串 s [i . . . j] 为一个回文串。$

$给定一个长度为 n 的字符串 s ，请找到最长回文子串及其长度$

做法

①枚举中心点以及回文串长度，在 $O(n^2)$ 复杂度下解决问题。

②字符串哈希，复杂度 $O (n l o g n)$

③后缀数组和快速LCA，复杂度 $O (n)$

④Manacher在解决这类问题相等简单，复杂度 $O (n)$ 且常数更小。

Manacher 算法

我们用 $d_1[i]和d_2[i]$ 分别表示以位置i为中心的长度为奇数和长度为偶数的回文串个数。

我们讨论寻找所有奇数长度的子回文串的情况。

维护已找到的最靠右的子回文串的边界 $(l, r)$ ,初始时设l=0,r=-1。

我们要对下一个 $i$ 进行转移，之前所有的 $d_1[i]$ 都已经计算完毕，通过下列方式进行计算：
$①当i处于当前子回文串外，即i>r时时，用朴素算法；\\ ②当i\leq r时，通过已计算的d_1[]中获得信息。\\（回文串中左右两边的d_i是相同的，都可以有d_1[i]=d_1[j]）\\ 当内部的回文串达到外部的边界，即j-d_1[j]+1\leq l时，外部的对称性没有保证。\\ 要先令d_1[i]=r-i，用朴素算法尽可能增加d_1[i]的值。$

模板

vector<int> d1(n);
for (int i = 0, l = 0, r = -1; i < n; i++) {
  int k = (i > r) ? 1 : min(d1[l + r - i], r - i + 1);
  while (0 <= i - k && i + k < n && s[i - k] == s[i + k]) k++;
  d1[i] = k--;
  if (i + k > r) {
    l = i - k;
    r = i + k;
  }
}

vector<int> d2(n);
for (int i = 0, l = 0, r = -1; i < n; i++) {
  int k = (i > r) ? 0 : min(d2[l + r - i + 1], r - i + 1);
  while (0 <= i - k - 1 && i + k < n && s[i - k - 1] == s[i + k])  k++;
  d2[i] = k--;
  if (i + k > r) {
    l = i - k - 1;
    r = i + k;
  }
}

统一处理

我们可以用一个小技巧将d1和d2的计算统一。

比如给定字符串s=ababc，n=5，我们可以转化为长度k=2*n+1的字符串s’=#a#b#a#b#c#。

在s中以一个字母为中心的长度为m+1的极大子回文串，对应在s’中的以相同字母为中心，长度为2m+3的极大子回文串；而s中一个以空为中心长度为m的极大子回文串，对应于s’中对应一个#为中心，长度为2m+1的极大子回文串。

简化后的模板

void getstr() {//重定义字符串
	int k = 0;
	str[k++] = '@';//开头加个特殊字符防止越界
	for (int i = 0; i < len; i++) {
		str[k++] = '#';
		str[k++] = s[i];
	}
	str[k++] = '#';
	len = k;
	str[k] = 0;//字符串尾设置为0，防止越界
}

int manacher() {
	int mx = 0, id;//mx为最右边，id为中心点
	int maxx = 0;
	for (int i = 1; i < len; i++) {
		if (mx > i) Len[i] = min(mx - i, Len[2 * id - i]);//判断当前点超没超过mx
		else Len[i] = 1;//超过了就让他等于1，之后再进行查找
		while (str[i + Len[i]] == str[i - Len[i]]) Len[i]++;//判断当前点是不是最长回文子串，不断的向右扩展
		if (Len[i] + i > mx) {//更新mx
			mx = Len[i] + i;
			id = i;//更新中间点
			maxx = max(maxx, Len[i]);//最长回文字串长度
		}
	}
	return (maxx - 1);
}

luoguP4555 国家集训队]最长双回文串

#include<bits/stdc++.h>
using namespace std;
const int N=3e5+7;
const int mod=1e9+7;
string str;
char s[N];
int k,ans=0,Len[N],ll[N],rr[N];


void Manacher(){
	int r=0,id,mx=0;
	for(int i=1;i<=k;i++){
		if(r>i) Len[i]=min(r-i,Len[2*id-i]); 
		else Len[i]=1;
		while(s[i+Len[i]]==s[i-Len[i]]) Len[i]++;
		ll[i+Len[i]-1]=max(Len[i]-1,ll[i+Len[i]-1]);
		rr[i-Len[i]+1]=max(Len[i]-1,rr[i-Len[i]+1]);
		if(Len[i]+i>r){
			r=Len[i]+i;
			id=i;
		}
	}
}

signed main(){
	cin>>str;
	k=0;
	s[0]='@';
	s[++k]='#';
	for(int i=0;i<str.size();i++){
		s[++k]=str[i];
		s[++k]='#';
	}
	s[++k]='\0';
	Manacher();
	for(int i=1;i<=k;i+=2) rr[i]=max(rr[i],rr[i-2]-2);
	for(int i=k-1;i>=1;i-=2) ll[i]=max(ll[i],ll[i+2]-2);
	for(int i=1;i<=k;i+=2) if(ll[i]&&rr[i]) ans=max(ans,ll[i]+rr[i]);		
	cout<<ans<<"\n";
	return 0;
}

哈希找最长回文子串

通过哈希同样可以 $O (n)$ 解决这个问题，具体方法就是记 $R_i$ 表示以 $i$ 作为结尾的最长回文的长度，那么答案就是 $max_{i=1}^n R_i$ 。考虑到 $R_i\leq R_{i-1}+2$ ，因此我们只需要暴力从 $R_{i-1}+2$ 开始递减，直到找到第一个回文即可。记变量 $z$ 表示当前枚举的 $R_i$ ，初始时为0，则在每次 $z$ 增大的时候都会增大2，之后每次暴力循环都会减少1，故暴力循环最多发生2n次，总的时间复杂度为 $O (n)$ 。