Manacher算法

背景介绍:

很多类似于如下的问题:

给定一个字符串,求出该字符串的最大回文长度.

比如:

s = "abba"

s = "hjkjh"

等.

如果用传统的方法进行暴力比较,以其中的每个字符为中心,两边逐渐对比,效率很差.复杂度是O(n^2)

后来有人提出了manacher算法(马拉车算法)

该算法的基本原理是:给定一个字符串hoabccccbacc,然后在该字符串内插入该字符串不曾出现的字符(比如:#),生成一组新的字符串

#h#o#a#b#c#c#c#cb#a#c#c#。为了防止越界,在最开始的地方插入一个特殊字符(比如:$)。于是乎,新的字符串就变成了$#h#o#a#b#c#c#c#cb#a#c#c#.这里插入后#之后,不管原来的字符串是偶数个还是奇数,最后都变成了奇数个.

在开始介绍该算法之前,先介绍两个变量.

p[i]:以第i个字符为中心的最大会问半径

mx:i+p[i],他是第i个字符最大回文半径的右边界.

第一步是造新的字符串:代码如下:

char* palindromic::insert(char *s)
{
	char *s_new = new char[1024];
    int len = strlen(s);
    s_new[0] = '$';
    s_new[1] = '#';
    int j = 2;

    for (int i = 0; i < len; i++)
    {
        s_new[j++] = s[i];
        s_new[j++] = '#';
    }

    s_new[j] = '\0';  // 字符串数组的结束
    
    return s_new;  // 返回 s_new 的长度
}
这里返回的就是我们上面提到的类似于$#h#o#a#b#c#c#c#cb#a#c#c#的字符串.

接下来就是对该字符串进行操作,也就是manacher算法.

int palindromic::manacher(char *s)
{
	char *s_new = insert(s);
    int len = strlen(s_new);
    int *p = new int[len];
	int max_len = -1;  

    int id;
    int mx = 0;

    for (int i = 1; i < len; i++)
    {
        if (i < mx)
            p[i] = min(p[2 * id - i], mx - i);  //(这里的解释请着重看下面的红色部分文字)
        else
            p[i] = 1;

        while (s_new[i - p[i]] == s_new[i + p[i]])  // 不需边界判断,因为左有'$',右有'\0'
            p[i]++;
        
        if (mx < i + p[i])//更新右边界
        {
            id = i;
            mx = i + p[i];
        }

        max_len = max(max_len, p[i] - 1);
    }

    return max_len;
}

 

这里面最核心的也是最难理解的部分就是这行代码:

            p[i] = min(p[2 * id - i], mx - i);  //(这里的解释请着重看下面的红色部分文字)
当i<mx。也就是目前处于如下图所示的状态:

虚线就是mx的位置,他是id的边界.j是i以id为中心的对称位置(2*id-i)

首先

只讨论当 i<mx的时候这种情况

重点:

A:2和3他一定是以id为中心对称的

B:1和4也一定是以id为中心对称的

C:1和2是以j为中心对称的

D:3和4是以i为中心对称的.

E:i和j是以id为中心对称的.

现在要求p[i]的初始值,那么他必须被约束在上述的范围内.

第一步:这里p[j]是在此之前就已经计算出来的结果.而i和j是关于id对称,这就必须要让p[i]=p[j].

可以自己举一个非常简单的例子,如果p[i]≠p[j]

a b c(j) b a .......(id).......k.b c(i) b l

这里p[i]=1, p[j] = 2,不相等,根本就无法满足id为中心左右对称的条件,因此必须得让p[i]=p[j]

但是呢?如果p[i]能没有限制的大吗?显然是不可以的.看下图:

假设d是多出来的那部分,那么以i为中心的对立面会有一个c跟他一样。而c和b又是以id为对称的,那么以j为中心的回文半径内会有一段与c对应的b,同理也就会存在以j为中心的对称的部分a.

可问题是我们在前面就已经计算出来了id的回文右边界是mx,但现在的回文范围已经是mx+最下面的两条紫线.这明显是不对的.

因此 p[i]的初始值要么是p[j],要么mx-i。只要取其中的最小值,就可以满足情况.

其余的代码就比较简单,这里就不再费事儿了.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值