论马拉车(manacher)

1前言

本文将介绍马拉车(manacher)算法
即回文串查找
初学者建议先掌握线性dp

2问题

如下图
在这里插入图片描述

我们发现,回文串必定对称,但对称轴其实有两种情况
1形如abcba,对称轴在一个字符上
2形如abba,对称轴在两个字符中间
我们可以将字符的两边插入一个占位字符,如’|'(是什么不重要,但是不要和题中的数据冲突)
这样,这两个字符串分别变成了
|a|b|c|b|a|,对称轴还是c
|a|b|b|a|,对称轴是’|’
这两个串对称轴全在字符上,对称轴不统一的问题解决了

3暴力枚举

我们发现,回文串最直观的性质是对称,上文有体现
我们可以利用这个性质打暴力,枚举每一个字符作为中心,向两侧扩展
为了防止越界,常规情况要加一个判断,左边界大于0,右边界小于等于字符串长度n(这里的n是插入占位字符之后的长度)
但是我们可以搞得简单一点,在串的左右加上不同字符,这样常数还小一点
时间复杂度O(n*n)
代码如下(作者为了方便已将小写字母转化为int型数字)

#include<bits/stdc++.h>
using namespace std;
string s;
int a[23333333];
int ans = 0;
int main(){
	cin>>s;
	int n = s.size()*2+2;
	a[0] = -114514;
	a[n] = 114514;
	for(int i = 1;i<n;i++){
		if(i&1){
			a[i] = -1;
		}else{
			a[i] = s[(i>>1)-1]-'a'+1;
		}
	}
	for(int i = 1;i<=n;i++){
		int cnt = 1,l = i-1,r = i+1;
		while(a[l]==a[r]){
			l--;
			r++;
			cnt+=2;
		}
		ans = max(ans,cnt);
	}
	cout<<(ans/2);
	return 0;
}

然后你就会获得66pts
这必须优化啊!

4考虑优化

我们分析一下,数据范围1e7左右,最多只能支持O(n)的复杂度
不难发现,暴力算法里面的那层循环非常慢
但是,如果数据里没有多个字符的回文串,暴力的复杂度竟然为O(n)(里面那层循环没运行)
为什么有了回文串,暴力就慢了呢
原来向两边搜索的操作重复了,即对于一个点i,如果处于回文串内,就会遍历到多次
我们能不能考虑一种算法,当i已经遍历到,在回文串内时,加速暴力算法…

5动态规划优化暴力

我们发现,重复访问…是不是似曾相识,还记得汉诺塔问题吗?
动态规划比搜索快的原因正式避免了重复计算
我们可以考虑用动态规划优化暴力
设置状态dp[i]表示以i为中心的回文串的半径的最大值
假定i点此时遍历到,并且在回文串内
我们考虑i点在回文串的对称点j,为什么考虑?因为j那边的情况和i这边是一样的,这就是回文串的对称性
访问一下dp[j],假设dp[j]也是个回文串,那么i这边也一定有回文串
但是,有可能最后算出来的dp[i]不等于dp[j],为什么?因为j所在的回文串不一定是i,j两点所在回文串的子串,即不一定被包含
举个例子比较容易理解
abacabd
此时假设x到b这个位置,我们不能保证i的后一位等于j的前一位,因为i的后一位根本不在这个大回文串里
我们考虑这个大回文串的右边界到i的距离和dp[j]取个min就行了
得状态转移方程dp[i] = min(dp[j],r-i+1)+l 其中l为之后能扩展的距离,先把已知跳过在向后扩展
所以我们总结出了要存的东西,大字符串的中心和右边界
但是,已求出的回文串可能有很多,留哪个?
肯定留右边界最靠右的那个啊,这样可以包含尽可能多的i
我们动态维护回文串的中心mid和右边界r
考虑时间复杂度,已知的回文串都跳过了,访问的都是未知的,这就O(n)
你可能会疑问,j那边如果不回文呢?
j不回文,i也不可能回文,这不还是O(n),过了
马拉车在哪?不是说好的讲马拉车吗?
这就是马拉车,马拉车就是线性dp

附代码

#include<bits/stdc++.h>
using namespace std;
string s;
int a[23333333],dp[23333333];
int ans = 0;
int main(){
	cin>>s;
	int mid = 1,n = s.size()*2+2,r = 0;
	a[0] = -114514;
	a[n] = 114514;
	for(int i = 1;i<n;i++){
		if(i&1){
			a[i] = -1;
		}else{
			a[i] = s[(i>>1)-1]-'a'+1;
		}
	}
	for(int i = 1;i<=n;i++){
		if(i<=r){
			dp[i] = min(dp[mid*2-i],r-i+1);
		}
		while(a[i+dp[i]]==a[i-dp[i]]){
			dp[i]++;
		}
		if(mid+dp[i]>r){
			mid = i;
			r = mid+dp[i];
		}
		ans = max(ans,dp[i]);
	}
	cout<<ans-1;
	return 0;
}

6后记

那些看似复杂的算法,一半以上都是基于dp或搜索这些基础算法
那些**所谓"题解"**只顾着搞懂马拉车是什么,却不知道马拉车是怎么被发明的
一切的算法都是从暴力开始的,看代码就知道马拉车和暴力其实没差多少
本文作者是蒟蒻,如有错误请各位神犇指点
森林古猿出品,必属精品,请认准CSDN森林古猿1

  • 25
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
马拉车算法是一种常用于字符串匹配的算法,其核心思想是利用回文串的对称性来减少比较次数。Java中可以通过以下步骤实现马拉车算法: 1. 预处理字符串,将字符串中的每个字符用一个特殊字符隔开,如:将字符串"abc"变成"#a#b#c#" 2. 维护一个数组P,其中P[i]表示以i为中心的最长回文子串的半径长度。具体实现时,可以使用一个中心点center和右边界right来维护,其中center表示当前已知的最长回文子串的中心点,right表示该回文子串的右边界。根据回文串的对称性,可以利用已知回文串的左侧字符的对称点来推出右侧字符的回文半径。 3. 遍历字符串,根据P数组更新center和right,并记录最长回文子串的起始位置和长度。 以下是Java代码实现示例: ```java public class ManacherAlgorithm { public static String longestPalindrome(String s) { if (s == null || s.length() == 0) { return ""; } StringBuilder sb = new StringBuilder(); sb.append("#"); for (int i = 0; i < s.length(); i++) { sb.append(s.charAt(i)); sb.append("#"); } String str = sb.toString(); int[] P = new int[str.length()]; int center = 0, right = 0; int start = 0, maxLen = 0; for (int i = 0; i < str.length(); i++) { if (i < right) { P[i] = Math.min(right - i, P[2 * center - i]); } while (i - P[i] - 1 >= 0 && i + P[i] + 1 < str.length() && str.charAt(i - P[i] - 1) == str.charAt(i + P[i] + 1)) { P[i]++; } if (i + P[i] > right) { center = i; right = i + P[i]; } if (P[i] > maxLen) { start = (i - P[i]) / 2; maxLen = P[i]; } } return s.substring(start, start + maxLen); } public static void main(String[] args) { String s = "babad"; System.out.println(longestPalindrome(s)); } } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值