OJ:L2-008 最长回文子串 Manacher算法(马拉车算法)

问题

对给定的字符串,本题要求你输出最长对称子串的长度。例如,给定Is PAT&TAP symmetric?,最长对称子串为s PAT&TAP s,于是你应该输出11。

输入格式:

输入在一行中给出长度不超过1000的非空字符串。

输出格式:

在一行中输出最长对称子串的长度。

输入样例:

Is PAT&TAP symmetric?

输出样例:

11

解析

Manacher算法可以用线性的时间复杂度解决上述问题,思想是基于对称解决问题。

首先,设置len数组用来保存每个位置最大回文子串的长度(实际上最终len数组保存的长度不一定正确,但是能保证结果正确)。对于每个新位置i,通过len[0]~len[i-1]计算len[i].

保存的max_pos和max_len说明目前从max_pos-max_len~max_pos+max_len的位置是回文的。如果当前位置i不在回文串里面,就盲目扩展即可。如果在回文串里面,则考虑其在串内的对称位置sym_pos.如果以sym_pos为中心的最大回文子串完全被max_pos的回文子串包括,而且没有达到边界,说明以i为中心的最大回文串也只能是这么长。反之,如果以sym_pos为中心的最大回文子串已经达到边界或者超过边界,说明有扩展的可能。此时不用从中心扩展,可以从max_pos对应的回文串的边界位置扩展:因为以i为中心的回文串包含在当前最大回文串内部的部分是完全回文的,所以可以从边界开始扩展。

最后,源程序中通过添加字符#的方式保证最后的回文串是奇数长度,避免偶数长度回文子串没有中心。

代码

#include <iostream>
#include <string>
#include <cstring>
#include <algorithm>
#include <stack>
#include <queue>
#include <vector>
#include <cmath>
#include <cstdio>
#include <bitset>
using namespace std;

const int N = 2000 + 5;

// 题目来源:https://pintia.cn/problem-sets/994805046380707840/problems/994805067704549376
// 参考:https://baike.baidu.com/item/Manachar%E7%AE%97%E6%B3%95/20415813

int raw_expand(char* str, int mid, int begin){
    // 中心为mid时,str中最大回文串, 从中心到最右的距离。
    // begin指的是,从mid-begin到mid+begin都已经配对了,返回的距离至少是begin
    begin++;
    while(mid-begin>=0 && mid+begin<strlen(str) && str[mid-begin]==str[mid+begin]) 
        begin++;
    return begin-1;
}

int Manacher(char* str){
    // 填充为奇数长度,例如str = 10填充为new_str = 21
    char new_str[N];
    for(int i=strlen(str); i>=0; i--){
        // 这样写有越界的危险,因为copy了str末尾的\0。但是其实没问题。
        new_str[2*i+1] = str[i];
        new_str[2*i] = '#';
    }
    // test
    // cout << new_str << endl;
    // 计算长度
    int len[N]; 
    // len[i]: 在新串中,以第i个字符为中心的回文串,从中心到最右的距离,只算扩展长度。
    // 例如a#b#c,b处的len为1,说明以b为中心,pos_b-1~pos_b+1是回文串
    int max_len = 0, max_pos = 0; // 当前最大的len元素和取得位置
    for(int i=1; i<strlen(new_str); i++){
        if(i < max_len + max_pos){ // i在当前最长回文串里面
            int sym_pos = 2* max_pos - i; // i在当前最长回文串里面的对称位置
            if(sym_pos - len[sym_pos] < max_pos - max_len){ 
                // sym_pos的最大子串被当前最大子串完全包含,而且没有扩展可能
                len[i] = len[sym_pos]; // 对称,i的最大子串被当前最大子串完全包含,所以是可以确定的
            }
            else{
                // 此时有 i + len[i] >= max_pos + max_len,直接从begin = max_pos + max_len - i开始
                len[i] = raw_expand(new_str, i, max_pos + max_len - i);
            }
        }
        else{
            // 没有信息,直接判断
            len[i] = raw_expand(new_str, i, 0);
        }
        // 最后更新max
        if(len[i] > max_len){
            max_len = len[i];
            max_pos = i;
        }
    }
    // test
    /*
    for(int i=0; i<strlen(new_str); i++){
        cout << len[i] << " ";
    }
    cout << endl;
    */
    // output
    return max_len;
}

int main(){
    char str[N];
    cin.get(str, N);
    cout << Manacher(str);
    return 0;
}

给出一个朴素O(n^2)做法加以对比:

#include <iostream>
#include <string>
#include <cstring>
#include <algorithm>
#include <stack>
#include <queue>
#include <vector>
#include <cmath>
#include <cstdio>
#include <bitset>
using namespace std;

const int N = 2000 + 5;

// 题目来源:https://pintia.cn/problem-sets/994805046380707840/problems/994805067704549376

int raw_expand(char* str, int mid, int begin){
    // 中心为mid时,str中最大回文串, 从中心到最右的距离。
    // begin指的是,从mid-begin到mid+begin都已经配对了,返回的距离至少是begin
    begin++;
    while(mid-begin>=0 && mid+begin<strlen(str) && str[mid-begin]==str[mid+begin]) 
        begin++;
    return begin-1;
}

int longest(char* str){
    // 填充为奇数长度,例如str = 10填充为new_str = 21
    char new_str[N];
    for(int i=strlen(str); i>=0; i--){
        // 这样写有越界的危险,因为copy了str末尾的\0。但是其实没问题。
        new_str[2*i+1] = str[i];
        new_str[2*i] = '#';
    }
    // 计算长度
    int len[N]; 
    // len[i]: 在新串中,以第i个字符为中心的回文串,从中心到最右的距离,只算扩展长度。
    // 例如a#b#c,b处的len为1,说明以b为中心,pos_b-1~pos_b+1是回文串
    int max_len = 0, max_pos = 0; // 当前最大的len元素和取得位置
    for(int i=1; i<strlen(new_str); i++){
        // 没有信息,直接判断
        len[i] = raw_expand(new_str, i, 0);
        //最后更新max
        if(len[i] > max_len){
            max_len = len[i];
            max_pos = i;
        }
    }
    // output
    return max_len;
}

int main(){
    char str[N];
    cin.get(str, N);
    cout << longest(str);
    return 0;
}

练习:LeetCode 5

  1. Longest Palindromic Substring

Given a string s, find the longest palindromic substring in s. You may assume that the maximum length of s is 1000.

Example 1:

Input: “babad”
Output: “bab”
Note: “aba” is also a valid answer.

Example 2:

Input: “cbbd”
Output: “bb”

在这里就不放代码了,两道题基本上是一样的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值