Common Substrings 【POJ - 3415】【后缀数组+单调栈】

题目链接


  不会做的时候看了网上的代码,但是发现他们都没有讲过程由来,这里我就大致的讲一下我和队友推出来的解题思路了。

  题目中,给出了一个K和两个字符串,我们现在想要知道的是,在两个字符串中出现长度大于等于K的相等子串这样的匹配对有几个?

  首先,考虑相等子串,确确实实的往后缀数组的LCP上想,也就是往height[]上靠,然后呢,就是求解的办法了,先想想看O(N*K)的解决办法,也就是从K~N的枚举所有的长度,我们来看所有的满足该长度的区间,每个区间对答案的贡献就是:(区间内的串1的个数 * 区间内的串2的个数 * (区间height的最小值 - 区间两边的最大值))

  再详细一点。

  例如说,我们看到height是{0,1,2,1,2,0},那么,第一个“1”制造的贡献区间是1~2,第一个“2”制造的贡献区间是2~3,第二个“1”会阻拦第一个“2”的区间,把它限制在里面,所以会使得“2”只能贡献与2~3了,并且它所制造的“相同程度为2”的贡献是2~3中的区间串1个数乘以串2个数。如果说被包围的值是Y的时候,周围是“X,Y,Z”,Y本身的贡献就是,(Y-min(X, Y)) * 区间中串1的个数 * 区间中串2的个数

  这样的话,我们确确实实可以说是完成了暴力的做法,该想办法优化了,如果我们能吧O(N * K)\approx O(N^2)优化成O(N),那么,这个问题就可以迎刃而解了。

  想一下,我们上面的{0,1,2,1,2,0}是不是可以确定每个值对应的区间范围,第一个“1”的贡献区间范围是可以跟第二个“1”一块合成成[1, 4],第一个“2”的区间贡献范围是[2, 3],第二个“2”的区间贡献范围是[4, 5],不难发现,其中有单调栈的缩影。

  也就是,我们现在来维护一个单调上升的(升序的)单调栈(栈底小于栈顶)。那么,如果新进来的点比栈顶小的话,那么栈顶的贡献就可以拎出去算了,因为这时候它的区间已经可以求解了。最后,有一个关键点,我们遇到相等的时候,要么就是弹出之前的,放进现在的,要么就是直接更新栈顶的元素信息——这样做的目的是为了如果后来的比它大的元素(在它之后入栈的元素)的左右区间是正确的。

  总结陈词:我们首先就是从维护区间height的角度来展开问题,再来就是对于height性质的拓展,由于他的“区间最小”的性质,我们可以去利用单调栈来降一维来线性时间的解决该问题。

1
INUIS
NISU
ans:6

以上是一组样例

#include <iostream>
#include <cstdio>
#include <cmath>
#include <string>
#include <cstring>
#include <algorithm>
#include <limits>
#include <vector>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <bitset>
//#include <unordered_map>
//#include <unordered_set>
#define lowbit(x) ( x&(-x) )
#define pi 3.141592653589793
#define e 2.718281828459045
#define INF 0x3f3f3f3f
#define HalF (l + r)>>1
#define lsn rt<<1
#define rsn rt<<1|1
#define Lson lsn, l, mid
#define Rson rsn, mid+1, r
#define QL Lson, ql, qr
#define QR Rson, ql, qr
#define myself rt, l, r
using namespace std;
typedef unsigned long long ull;
typedef unsigned int uit;
typedef long long ll;
const int maxN = 2e5 + 7;
struct SA
{
    int n, m;
    int s[maxN];
    int y[maxN], x[maxN], c[maxN], sa[maxN], rk[maxN], height[maxN];
    inline void get_SA()
    {
        for(int i=1; i<=m; i++) c[i] = 0;   //桶的初始化
        for(int i=1; i<=n; i++) ++c[x[i] = s[i]];
        for(int i=2; i<=m; i++) c[i] += c[i - 1];   //利用差分前缀和的思想知道每个关键字最多是在第几名
        for(int i=n; i>=1; i--) sa[c[x[i]]--] = i;
        for(int k=1; k<=n; k<<=1)
        {
            int num = 0;
            for(int i=n - k + 1; i<=n; i++) y[++num] = i;
            for(int i=1; i<=n; i++) if(sa[i] > k) y[++num] = sa[i] - k; //是否可以作为第二关键字
            for(int i=1; i<=m; i++) c[i] = 0;
            for(int i=1; i<=n; i++) c[x[i]]++;  //因为上一次循环已经求出这次的第一关键字了
            for(int i=2; i<=m; i++) c[i] += c[i - 1];
            for(int i=n; i>=1; i--) //在同一第一关键字下,按第二关键字来排
            {
                sa[c[x[y[i]]]--] = y[i];
                y[i] = 0;
            }
            swap(x, y);
            x[sa[1]] = 1; num = 1;
            for(int i=2; i<=n; i++)
            {
                x[sa[i]] = (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k]) ? num : ++num;
            }
            if(num == n) break;
            m = num;
        }
    }
    inline void get_height()
    {
        int k = 0;
        for(int i=1; i<=n; i++) rk[sa[i]] = i;
        for(int i=1; i<=n; i++)
        {
            if(rk[i] == 1) continue;    //第一名的height为0
            if(k) k--;  //height[i] >= height[i - 1] - 1
            int j = sa[rk[i] - 1];
            while(j + k <= n && i + k <= n && s[i + k] == s[j + k]) k++;
            height[rk[i]] = k;
        }
    }
    inline void clear()
    {
        n = 0; m = 200;
    }
} sa;
int K, len, N_mid, Stop;
char s[maxN];
ll ans;
struct node
{
    ll val, pos, cnt_A, cnt_B;
    node(ll a=0, ll b=0, ll c=0, ll d=0):val(a), pos(b), cnt_A(c), cnt_B(d) {}
} Stap[maxN];
ll num_AB[2], tmp_AB[2];
inline void solve()
{
    Stop = 0;
    memset(num_AB, 0, sizeof(num_AB));
    for(int i=1; i<=sa.n - 1; i++)
    {
        if(sa.height[i] < K)    //小于K的时候直接算里面的贡献即可
        {
            while(Stop)
            {
                tmp_AB[0] = Stap[Stop - 1].cnt_A; tmp_AB[1] = Stap[Stop - 1].cnt_B;
                tmp_AB[sa.sa[Stap[Stop - 1].pos] > N_mid] --;
                ans += 1LL * (Stap[Stop].val - Stap[Stop - 1].val) * (num_AB[0] - tmp_AB[0]) * (num_AB[1] - tmp_AB[1]);
                Stop--;
            }
            num_AB[sa.sa[i] > N_mid] ++;
            Stap[0] = node(K - 1, i, num_AB[0], num_AB[1]);
            continue;
        }
        while(Stop && sa.height[i] < Stap[Stop].val)
        {
            tmp_AB[0] = Stap[Stop - 1].cnt_A; tmp_AB[1] = Stap[Stop - 1].cnt_B;
            tmp_AB[sa.sa[Stap[Stop - 1].pos] > N_mid] --;
            ans += 1LL * (Stap[Stop].val - max(Stap[Stop - 1].val, 1LL * sa.height[i])) * (num_AB[0] - tmp_AB[0]) * (num_AB[1] - tmp_AB[1]);
            Stop--;
        }
        num_AB[sa.sa[i] > N_mid] ++;
        if(sa.height[i] > Stap[Stop].val) Stap[++Stop] = node(sa.height[i], i, num_AB[0], num_AB[1]);
        else if(sa.height[i] == Stap[Stop].val) { Stap[Stop].cnt_A = num_AB[0]; Stap[Stop].cnt_B = num_AB[1]; Stap[Stop].pos = i; }
    }
}
int main()
{
    while(scanf("%d", &K) && K)
    {
        sa.clear(); ans = 0;
        scanf("%s", s + 1);
        len = (int)strlen(s + 1);
        for(int i=1; i<=len; i++) sa.s[++sa.n] = s[i];
        sa.s[++sa.n] = 'a' + 26;
        N_mid = sa.n;
        scanf("%s", s + 1);
        len = (int)strlen(s + 1);
        for(int i=1; i<=len; i++) sa.s[++sa.n] = s[i];
        sa.s[++sa.n] = 'a' + 27;
        sa.get_SA();
//        for(int i=1; i<=sa.n; i++) printf("%d ", sa.sa[i]); puts("");
        sa.get_height();
//        for(int i=1; i<=sa.n; i++) printf("%d ", sa.height[i]); puts("");
        solve();
        printf("%lld\n", ans);
    }
    return 0;
}

 

警示语:以后一定要记住单调栈相等元素的处理问题!在这上面犯错了…… 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Wuliwuliii

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值