Manacher算法解决最长回文子串问题-Java版

最新推荐文章于 2022-12-15 21:38:04 发布

gaoyueace

最新推荐文章于 2022-12-15 21:38:04 发布

阅读量528

点赞数

分类专栏： Java算法与数据结构文章标签： Manacher算法马拉车算法最长回文子串问题 Java

本文链接：https://blog.csdn.net/gaoyueace/article/details/90217098

版权

Java算法与数据结构专栏收录该内容

17 篇文章 2 订阅

订阅专栏

Manacher算法解决最长回文子串问题

最长回文子串问题，就是给定一个字符串，求出字符串中最长回文子串的长度。回文串就是从头到尾遍历和从尾到头遍历是一模一样的。
暴力求解，把字符串所有子串都找出来，再挨个判断是否为回文子串，再记录最长的长度，这个方法当然是可以的，但是复杂度太高！不推荐！
所以设计了Manacher算法(马拉车算法)用来解决最长回文子串问题！

字符串初始化处理

奇数长和偶数长的回文子串的字符中心是不一样的，不好判断，为了解决这个问题，Manacher算法将所有字符串的长度都变成奇数，方法就是在原字符串的相邻字符之间加分隔符（比如说#），例如ababc，变成#a#b#a#b#c#；abab，变成#a#b#a#b#。所有字符串长度都是奇数，还不影响回文性。

回文半径存储数组的定义

Manacher算法还建立了一个辅助数组，用来存储以str[i]为中心的回文字符串的回文半径的长度。例如回文字符串：#a#b#a#b#a#，以第三个a为中心，即str[5]为中心，这个回文字符串的长度为11，而回文半径是回文字符串长度的一半，即(11+1)/2=6，（要包括回文中心字符），所以len[5]=6。
这里要注意一点的是：调整后加入#的字符串str，以str[i]为中心的回文字符串的长度为2×len[i]-1，而其中有len[i]个分隔符#，所以原字符串的长度为len[i]-1。也就是说最后只要输出len中最大的数字-1就是最长回文子串的长度。

回文半径存储数组的计算

Manacher算法的精髓就是只需要从头到尾遍历str一次！！！

如何实现呢？我们需要设置两个标志位，centre和right，centre是当前回文子串的中心点，right是当前回文子串的右边界(right并不包含在回文子串中！)。一开始初始化，centre=right=-1。当i从0遍历到str.length-1时，需要动态的改变centre和right值，就可以计算出以str[i]为中心的回文半径存入len数组中。

这里需要注意的是，i一定>=centre，有了i的推进，centre和right才会更新。

什么时候要改变centre和right值呢，有两大情况：

当i值在right的左边：即 centre<=i<right，如下图

图中 l 是以cen为中心的回文子串的左边界，j 为 i 以 cen 为中心的对称点。我们要时刻注意到回文特性，即 str[l+1...cen-1] 与 str[r-1...cen+1]是相同的，所以以 i 为中心的回文子串有可能与以 j 为中心的回文子串是一样的，至少有一部分是相同的。

接下来，这里根据 以 j 为中心的回文子串的长度不同，会再细分成两种情况：
（1）以 j 为中心的回文子串很短，如下图

这种情况下，len[i]至少跟len[j]一样大，为什么至少一样大，什么时候len[i]比len[j]大呢，以上图为例，以 i 为中心的回文子串的右边界还可以向右扩展，这扩展的部分在 j 是无法匹配的。所以可以先将len[i]保存为len[j]，再以i为中心左右两边扩展。

（2）以 j 为中心的回文子串很长，如下图

以 j 为中心的回文子串很长，可以看出左边界已经超过了 l ，但是以 i 为中心的回文字符长度，如果只按照回文性来判断，len[i]的值现在只能确定为 r-i ，len[i]<len[j]，因为如图中红色单元格所示，这些单元格是否满足回文还需要进一步判断，所以 len[i] = r-i，再以i为中心左右两边扩展。

上面两个情况合并一下，即当i值在right的左边时，因为不知道当前j符合哪一种情况，所以 len=Math.min(len[2*cen-i], right-i)，取两个中间的最小值即可。
当i值在right的右边：即 i>=right

说明以 i 为中心的回文子串还没有被访问过，所以当前len[i]的长度为1，即为i本身，再以i为中心左右两边扩展。

Manacher算法-Java版

// 处理字符串
public static char[] manacherString(String str){
    char[] chars = str.toCharArray();
    char[] res = new char[chars.length*2+1];
    int index = 0;
    for(int i=0;i<res.length;i++)
        // 偶数位加 # ，奇数位不变
        res[i] = (i&1)==0?'#':chars[index++];
    return res;
}

// 马拉车算法
public static int maxLcpsLength(String str){
    char[] chars = manacherString(str);
    int[] len = new int[chars.length]; // 记录每个回文字符串的长度
    int right = -1; // 当前回文的右边界
    int cen = -1; // 当前回文的中心
    int max = -1; // 记录回文的最大值
    for(int i=0;i<chars.length;i++){
    
        // 2*cen-i是i点关于cen的对称点
        // right>i时，Math.min(len[2*cen-i], right-i)，两种情况取最小，往外扩
        // right<=i时，以i为中心的回文没有被访问过，所以当前回文字符串只有i，len[i]=1
        len[i] = right>i? Math.min(len[2*cen-i], right-i) : 1;
        
        // 以i为中心，左右扩
        while(i-len[i]>-1 && i+len[i]<chars.length){
            if(chars[i-len[i]]==chars[i+len[i]])
                len[i]++; // 左右字符相等，符合回文，len++；
            else
                break;
        }
        // 更新当前回文的右边界以及中心
        if(i+len[i]>right){
            right = i + len[i];
            cen = i;
        }
        max = Math.max(max, len[i]);
    }
    return max-1;
}