[51nod17E] Simple KMP 解题报告

最新推荐文章于 2024-09-10 15:03:43 发布

Joker_69

最新推荐文章于 2024-09-10 15:03:43 发布

阅读量446

点赞数 2

分类专栏：题解字符串数据结构线段树文章标签：后缀自动机字符串数据结构 51nod

本文链接：https://blog.csdn.net/Joker_69/article/details/81395348

版权

题解同时被 3 个专栏收录

7 篇文章 0 订阅

订阅专栏

数据结构

5 篇文章 0 订阅

订阅专栏

字符串

2 篇文章 0 订阅

订阅专栏

传送门

Analysis & Solution

$f(S)$ 其实就是 $S$ 所有前缀出现次数减一的和，因为这里定义的深度 $h[i]$ 等于其非空border的数量，就意味着有一个子串与一个前缀相等，交换求和次序即前缀在非前缀子串中出现次数的和。（我TM连第一步转化都没想对，我转化成了 $\sum_r(|S|-r+1)\sum_l h_l[r]$ )

这样 $key(S)$ 就是考虑 $S$ 的一个子串 $T$ 出现的right集合 $\{r_1,r_2,\ldots,r_p\}$ ，其中一对位置 $(r_i,r_j)$ 的贡献是 $|S|-r_j+1$ 。

现在考虑算出在末尾加一个字符带来的增量。对于right集合不变的结点，是对所有 $\binom p2$ 种方案长度都增加1（这里 $p$ 表示right当前集合的大小）。这用一个全局变量 $cur$ 记下 $\sum\binom p2$ 即可。如果right集合变大了（位于末点到根的链上），可先另 $cur\text{+=}\sum p\text{++}$ 维护出 $p$ 增加后的 $cur$ ，再使 $ans\text{+=}cur$ 。相当于先再结尾加一个点，其方案对应长度均为0，再令所有方案增加1的长度。当然，这里讨论的贡献还得乘上 $len[i]-len[par[i]]$

由于不需要在线，可以先把整个SAM建出来然后链剖，避免LCT。

Implementation

这里我们需要一个资辞区间加、区间和的线段树，用树状数组可以简便的实现。但是现在要带上 $len-len[par]$ 的权值，需对模板作些修改。

ll A[N]; int B[N];
template <typename T>
void add(T (&tr)[N], int x, int w) {
    do tr[x] += w;
    while ((x += x&-x) <= tim);
}
template <typename T>
T sum(T (&tr)[N], int x) {
    T s = 0;
    do s += tr[x]; while (x ^= x&-x);
    return s;
}
void update(int l, int r) {
    add(A, l, l);
    add(B, l, 1);
    add(A, r+1, -r-1);
    add(B, r+1, -1);
}
ll query(int l, int r) {
    return (r+1)*sum(B, r) - sum(A, r)
        - (l*sum(B, l-1) - sum(A, l-1));
}

原来是考虑区间加拆成一个在i处+1以后，对区间和拆成的一个j处的前缀和的贡献，等于 $(j-i+1)[i\le j]$ 。把这个贡献拆成 $-i$ 和 $j+1$ 两部分，分别用A和B维护。

现在贡献变成 $(s[j]-s[i-1])[i\le j]$ ，其中 $s$ 是 $len[i]-len[par[i]]$ 的前缀和。也可以拆成两部分，只要把r+1等地方改一下就可以了。

但要注意，应该把 $len$ 的差分按dfs序重排后再前缀和。我一开始认为链剖处理的区间不会跨过树上不连续的链，所以可以直接传树上 $len$ 进去。事实证明死得很惨，大概是因为在l-1,r+1的时候就会跑出去。

p.s. 我又把SAM写错了。。。少了一句 par[nq] = par[q];

Code

#include <vector>
#include <cstdio>
#include <cstring>
typedef long long ll;
const int S = 100032, N = S*2, MOD = 1000000007;

char s[S];
int go[N][26], par[N], len[N], cnt = 1, p = 1;

void extend(int c) {
    int np = ++cnt;
    len[np] = len[p] + 1;
    for (; p && !go[p][c]; p = par[p]) go[p][c] = np;
    if (p) {
        int q = go[p][c];
        if (len[q] != len[p] + 1) {
            int nq = ++cnt;
            len[nq] = len[p] + 1;
            par[nq] = par[q];
            memcpy(go[nq], go[q], sizeof *go);
            for (; p && go[p][c] == q; p = par[p]) go[p][c] = nq;
            par[q] = par[np] = nq;
        }
        else par[np] = q;
    }
    else par[np] = 1;
    p = np;
}

std::vector<int> ch[N];
int son[N], top[N], dfn[N], tim;
ll _len[N];

int dfs1(int x) {
    int sz = 1, mx = 0;
    for (int u : ch[x]) {
        int s = dfs1(u); sz += s;
        if (mx < s) mx = s, son[x] = u;
    }
    return sz;
}

void dfs2(int x) {
    dfn[x] = ++tim;
    _len[tim] = len[x] - len[par[x]];
    if (int v = son[x]) {
        top[v] = top[x]; dfs2(v);
        for (int u : ch[x])
            if (u ^ v) dfs2(top[u] = u);
    }
}

int B[N]; ll A[N], ans, cur;
template <typename T>
inline void add(T (&tr)[N], int x, T w) {
    do tr[x] += w;
    while ((x += x&-x) <= tim);
}
template <typename T>
inline T sum(T (&tr)[N], int x) {
    T s = 0;
    do s += tr[x]; while (x ^= x&-x);
    return s;
}

void query(int l, int r) {
    ll wl = _len[l-1], wr = _len[r];
    cur += wr * sum(B, r) - sum(A, r)
        - wl * sum(B, l-1) + sum(A, l-1);
    add(A,  l,   wl); add(B, l, 1);
    add(A, r+1, -wr); add(B, r+1, -1);
}

int main() {
    int n;
    scanf("%d%s",&n,s);
    for (int i = 0; i < n; i++)
        extend(s[i] -= 'a');
    for (int i = 2; i <= cnt; i++)
        ch[par[i]].push_back(i);
    dfs1(1);
    dfs2(top[1] = 1);
    for (int i = 0; i < tim; i++)
        _len[i+1] += _len[i];
    for (int x = 1, i = 0; i < n;) {
        int u = x = go[x][s[i++]];
        do query(dfn[top[u]], dfn[u]);
        while (u = par[top[u]]);
        if ((ans += cur %= MOD) >= MOD) ans -= MOD;
        printf("%lld\n",ans);
    }
    return 0;
}

Joker_69

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
[51nod17E] Simple KMP 解题报告

对字符串S,将i向KMP的fail[i]连边,形成一颗树的形状,设f(S)是除了0以外所有点深度和,其中0号点的深度为-1。定义key(S)为所有非空子串S'的f(S')之和。每次在S最后添加一个字符，并输出key(S)
复制链接

扫一扫

专栏目录