马拉车算法

最新推荐文章于 2024-09-22 22:02:19 发布

fxt275307894a

最新推荐文章于 2024-09-22 22:02:19 发布

阅读量136

点赞数

分类专栏：总结文章标签：算法字符串

本文链接：https://blog.csdn.net/fxt275307894a/article/details/104940069

版权

总结专栏收录该内容

14 篇文章 0 订阅

订阅专栏

马拉车算法是一种计算最长回文子串的算法，以其优秀的线性复杂度闻名于世，相较于 $O(n^2)$ 的 $d p$ 算法和会被特殊数据卡到 $O(n^2)$ 的暴力算法，马拉车算法无疑是求解最长回文子串的最优选择。
最长回文子串分为偶数串和奇数串，为了避免这些问题，马拉车算法将每个字符与字符间插入一个特殊字符，在两头插入不同的字符，以免越界。
马拉车算法定义: $r$ 为当前已知的对称的最右边的点， $m i d$ 为 $r$ 的对称轴， $f_i$ 为以 $i$ 为对称轴的最长回文子串的回文半径
则我们遇到一个 $i$ ，分两种情况讨论
若 $\leq i \leq r$ ,则 $f_i$ 可能为他的对称点，即 $f_{mid*2-i}$ ,但如果 $i+f_{mid*2-i}$ 大于了 $r$ ，则就不能保证它的正确性，而能保证正确性的区域在哪儿呢?只有 $r$ 以内，所以要和 $r - i + 1$ 取一个 $m i n$ ，然而我们不能保证它的最长回文子串一定是这个范围，所以我们要暴力拓展一下，直到不能拓展为止。
若 $r < i$ ,那么暴力拓展即可。
而做完这一切后，看看 $r$ 和 $m i d$ 有没有要更新的。
而我们统计答案时一定要减掉插入的字符，我们发现，统计出来的回文半径一定是一个奇数，则结尾是一个 $\#$ ，将对面的对过来，得到答案为 $f_i-1$ 最终答案即为 $min(f_i)-1$
那么马拉车算法的时间复杂度是怎么证明为线性呢?
若是 $\leq i \leq r$ 且取值为 $f_{mid*2-i}$ ，那么是一定不会拓展的，因为这还在这个回文半径里面，两边肯定是相同的
而其他两种情况， $r$ 是一定随着动的。所以复杂度为线性，即 $O (n)$
代码实现:

#include<cstdio>
#include<cstring>
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))
using namespace std;
int n,m,k,f[2000039],mr,mid,ans;
char s[2000039],x;
int main(){
	register int i;
	s[++n]='%';
	s[++n]='#';
	x=getchar();
	while(x>='a'&&x<='z') s[++n]=x,s[++n]='#',x=getchar();
	s[++n]='&';
	mr=mid=1;
	for(i=2;i<n;i++){
		if(i<mr) f[i]=min(f[mid*2-i],mr-i+1);
		while(s[i+f[i]]==s[i-f[i]]) f[i]++;
		if(f[i]+mid>mr) mr=f[i]+i-1,mid=i;
		ans=max(ans,f[i]-1);
	}
	printf("%d\n",ans);
}