最长对称子串

(java实现)


题目描述:

给定一个字符串(数字或大小写字母), 找出最长的对称的子串(如有多个,输出任意一个)。
例如:
输入:“abbaad”
输出:“abba”

输入描述:

字符串

输出描述:

字符串

示例1:

输入

a1223a

输出

22


问题分析:

解题思路:
方法一:判断字符串的每一个子串,若是对称的,则求出它的长度即可。这种办法对每一个子串,从两头向中间判断是不是子串。
暴力法:总的时间复杂度为O(n^3),
方法二:与方法一正好相反,字符串中的每一个开始,向两边扩展,此时可分为两种情况:
(1)对称子串长度是奇数时,以当前字符为对称轴向两边扩展比较;
(2)对称子串长度是偶数时,以当前字符和它右边的字符为对称轴向两边扩展;
该种方法的时间复杂度是O(n^2)。

思路一:Manacher算法(O(n))
求回文串时需要判断其奇偶性,也就是求aba和abba的算法略有差距。然而,这个算法做了一个简单的处理,很巧妙地把奇数长度回文串与偶数长度回文串统一考虑,也就是在每个相邻的字符之间插入一个分隔符,串的首尾也要加,当然这个分隔符不能再原串中出现,一般可以用‘#’或者‘$’等字符(从而不需要考虑长度是奇数还是偶数)。

例如:
原串:abaab
新串:#a#b#a#a#b#
这样一来,原来的奇数长度回文串还是奇数长度,偶数长度的也变成以‘#’为中心的奇数回文串了。
接下来就是算法的中心思想,用一个辅助数组P记录以每个字符为中心的最长回文半径,也就是P[i]记录以S[i]字符为中心的最长回文串半径。P[i]最小为1,此时回文串为Str[i]本身。
为了防止求P[i]向两边扩展时可能数组越界,我们需要在数组最前面和最后面加一个特殊字符,令P[0]=‘$’,最后位置默认为‘\0’不需要特殊处理 。
我们可以对上述例子写出其P数组,如下:
新串: # a # b # a # a # b #
P[] : 1 2 1 4 1 2 5 2 1 2 1
我们可以证明P[i]-1就是以S[i]为中心的回文串在原串当中的长度。
证明:
1、显然L=2*P[i]-1即为新串中以S[i]为中心最长回文串长度。
2、以S[i]为中心的回文串一定是以#开头和结尾的,例如“#b#b#”或“#b#a#b#”所以L减去最前或者最后的‘#’字符就是原串中长度的二倍,即原串长度为(L-1)/2,化简的P[i]-1。
那么怎么计算P[i]呢?该算法增加两个辅助变量(其实一个就够了,两个更清晰)id和mx,其中id表示最大回文子串中心的位置,mx则为id+P[id],也就是最大回文子串的边界。依次从前往后求得P数组就可以了,这里用到了DP(动态规划)的思想,也就是求P[i]的时候,前面的P[]值已经得到了,我们利用回文串的特殊性质可以进行一个大大的优化。我先把核心代码贴上:
这个算法的关键点就在这里了:
if(mx > i)
P[i] >= MIN(P[2 * id - i], mx - i)

//记j = 2 * id - i,也就是说 j 是 i 关于 id 的对称点。
if (mx - i > P[j]) 
    P[i] = P[j];
else /* P[j] >= mx - i */
    P[i] = mx - i; // P[i] >= mx - i,取最小值,之后再匹配更新。

当 mx - i > P[j] 的时候,以S[j]为中心的回文子串包含在以S[id]为中心的回文子串中,由于 i 和 j 对称,以S[i]为中心的回文子串必然包含在以S[id]为中心的回文子串中,所以必有 P[i] = P[j],见下图:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tlZqwUfZ-1618556875072)(https://uploadfiles.nowcoder.com/images/20210322/4479402_1616382428973/4A47A0DB6E60853DEDFCFDF08A5CA249 “图片标题”)]
当 P[j] >= mx - i 的时候,以S[j]为中心的回文子串不一定完全包含于以S[id]为中心的回文子串中,但是基于对称性可知,下图中两个绿框所包围的部分是相同的,也就是说以S[i]为中心的回文子串,其向右至少会扩张到mx的位置,也就是说 P[i] >= mx - i。至于mx之后的部分是否对称,就只能老老实实去匹配了。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vCEqg6OG-1618556875075)(https://uploadfiles.nowcoder.com/images/20210322/4479402_1616382438773/FB5C81ED3A220004B71069645F112867 “图片标题”)]
对于 mx <= i 的情况,无法对 P[i]做更多的假设,只能P[i] = 1,然后再去匹配了。

动态规划(DP)
思想:DP的考虑源于暴力方法,暴力方法是寻找一个字符串的所有子串,需要O(n2)的开销,然后对于每一个子串需要O(n)的开销来判断是否是回文,故暴力方案为O(n3),但是这里有一个问题,就是在暴力的时候有重复判断;
例如,如果子串X为回文,那么sXs也是回文;如果X不是回文,那么sXs也不是回文;另外,ss也是回文。所以这里使用DP我们可以按照子串长度从小到大的顺序来构建DP状态数组,使用一个二维数组dp[i][j]记录子串[i-j]是否为回文子串,那么我们就有初始化和自底向上的方案了;
初始化:单字符串和相等的双字符串为回文
自底向上构造:X[i]==X[j] && dp[i+1][j-1]==1 则dp[i][j] = 1

相关知识:

Manacher算法和动态规划。


参考代码:

思路一实现:

import java.util.*;
public class Main {
        
    public static void main(String[] args)
    {
        Scanner input = new Scanner(System.in);
        while (input.hasNext())
        {
            String line = input.nextLine();
            StringBuilder str = new StringBuilder();
            str.append("$#");
            for (int i=0; i<line.length(); i++)
            {
                str.append(line.charAt(i)+"#");
            }
            int[] len = new int[str.length()];
            //pos为中心位置,mx为右侧最远,resMax为最长子串长度,resId为下标
            int pos=0, mx=0, resMax=0, resId=0;
            for (int i=1; i<str.length(); i++)
            {
                //马拉车算法关键步骤
                if (mx > i)
                {
                    len[i] = Math.min(len[2*pos-i],mx-i);
                }
                else
                {
                    len[i] = 1;
                }
                //
                /*
                while (str.charAt(i+len[i]) == str.charAt(i-len[i]))
                {
                    len[i]++;
                }*/
                while (i+len[i]<str.length() && i-len[i]>-1)
                {
                    if (str.charAt(i+len[i]) == str.charAt(i-len[i]))
                        len[i]++;
                    else
                        break;
                }
                //若长度有变化,则更新长度
                if (mx-i < len[i])
                {
                    mx = len[i]+i;
                    pos = i;
                }
                //记录最长信息
                if (resMax < len[i])
                {
                    resMax = len[i];
                    resId = i;
                }
            }
            int begin = (resId-resMax)/2;
            String res = line.substring(begin, begin+resMax-1);
            //C++ stringvar.substr(start [, length ])
            //String res = line.substring((resId-resMax)/2, resMax-1);
            System.out.println(res);
        }
    }
}

思路二实现:


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值