第十一届十月份蓝桥杯省赛 H - 子串分值和:求字符串所有子串的不同字符个数和(思维/线段树)

题目大意

在这里插入图片描述

解法一:标答

这种解法应该就是标答了吧,在这里学到的,简单精炼而又高效,orz

对于一个长度为 n n n的字符串,若我们考虑所有子串的个数,可以考虑以下做法:考虑第 i i i个字符,它和前面字符加起来的长度为 x x x,它和后面字符加起来的长度为 y y y,那么包含字符 i i i的所有子串就有 x × y x \times y x×y

例如对于字符串 a b c d abcd abcd,其子串的个数和为 1 × 4 + 2 × 3 + 3 × 2 + 4 × 1 1 \times 4+ 2 \times 3 + 3 \times 2+4 \times 1 1×4+2×3+3×2+4×1

那么我们考虑每个字符在包含他的所有子串,然后减去重复的即可。什么样的是重复的?我们从左向右考虑每个字符,那么前面第一个和该字符相同的字符的前缀就是重复计算的,那么我们减去这段前缀的长度即可。

例如 X X X X a b c a X X X X XXXXabcaXXXX XXXXabcaXXXX,对于第一个 a a a我们可以没有顾虑的统计,加上包含它的所有子串即可,对于第二个 a a a,显然我们统计其前缀时有可能包含第一个 a a a,设第一个 a a a的下标为 z z z,上述计算子串的公式在这里就要转化为 ( x − z ) × y (x-z) \times y (xz)×y,这样程序就很容易写出来了。

时间复杂度 O ( n ) O(n) O(n)

#include <bits/stdc++.h>

using namespace std;
typedef long long ll;
const int maxn = 2e5 + 10;

char s[maxn];
int pre[maxn];

int main() {
    cin >> s + 1;
    int n = strlen(s + 1);
    ll ans = 0;
    for (int i = 1; i <= n; i++) {
        ans += 1LL * (i - pre[s[i] - 'a']) * (n - i + 1);
        pre[s[i] - 'a'] = i;
    }
    cout << ans << endl;
    return 0;
}
解法二:线段树

这种解法是我在现场比赛想到的,可惜当时时间不够了,打了个暴力水了这道题…(似乎时间够这题也不好调,线段树/树状数组的题目我好久没写了,菜死了qwq)

对于一个字符串 s s s的子串,设其区间为 [ l , r ] [l,r] [l,r],那么字符串的所有子串等价于 ∑ l = 1 n ∑ r = l n s ( l , r ) \sum_{l=1}^n\sum_{r=l}^ns(l,r) l=1nr=lns(l,r)

首先我们可以从前向后遍历 l = 1 l=1 l=1 r ∈ [ 1 , n ] r\in [1,n] r[1,n]的所有情况求出每个位置上 s ( 1 , i ) s(1,i) s(1,i)的不同字符个数保存到权值数组中,考虑固定右端点 r = n r=n r=n,当 l l l左移时,该位置的下一个相同字符之间的所有字符的权值都会减一;如果这就是该字符最后出现的位置,那么只有下一个位置才会减一。如下表:

             a    b    c    a    a    b l = 1 : 1    2    3    3    3    3 l = 2 :      1    2    3    3    3 l = 3 :          1    2    2    3 l = 4 :              1    1    2 l = 5 :                  1    2 l = 6 :                      1 ~~~~~~~~~~~~a~~b~~c~~a~~a~~b \\ l=1:1~~2~~3~~3~~3~~3 \\ l=2:~~~~1~~2~~3~~3~~3 \\ l=3:~~~~~~~~1~~2~~2~~3 \\ l=4:~~~~~~~~~~~~1~~1~~2 \\ l=5: ~~~~~~~~~~~~~~~~1~~2 \\ l=6: ~~~~~~~~~~~~~~~~~~~~1             a  b  c  a  a  bl=1:1  2  3  3  3  3l=2:    1  2  3  3  3l=3:        1  2  2  3l=4:            1  1  2l=5:                1  2l=6:                    1

那么我们需要第一次初始化权值数组,预处理出每个字符的下一个相同字符的位置。然后每次移动 l l l,即从左向右遍历,对于修改操作只需要线段树区间修改,答案也是区间查询。树状数组同理。

时间复杂度 O ( n l o g n ) O(nlogn) O(nlogn)

PS:实际上固定左端点在最左端,考虑不断移动右端点,实际上和上面类似却又相反,会得到降序的序列,同样是考虑每个字符的前一个字符中间的区间修改,和前缀的查询,也是用线段树/树状数组维护就行



//
// Created by Happig on 2020/10/26
//
#include <bits/stdc++.h>
#include <unordered_map>
#include <unordered_set>

using namespace std;
#define fi first
#define se second
#define pb push_back
#define ins insert
#define Vector Point
#define ENDL "\n"
#define lowbit(x) (x&(-x))
#define mkp(x, y) make_pair(x,y)
#define mem(a, x) memset(a,x,sizeof a);
typedef long long ll;
typedef long double ld;
typedef unsigned long long ull;
typedef pair<int, int> pii;
typedef pair<ll, ll> pll;
typedef pair<double, double> pdd;
const double eps = 1e-8;
const double pi = acos(-1.0);
const int inf = 0x3f3f3f3f;
const double dinf = 1e300;
const ll INF = 1e18;
const int Mod = 1e9 + 7;
const int maxn = 2e5 + 10;

char s[maxn];
int a[maxn], d[maxn], c[maxn], nextAlpha[maxn];
int num[26], nxt[26];
int n;

struct tree {
    int l, r;
    int sum;
    int lazy;

    tree() { l = r = sum = lazy = 0; }
} sgt[maxn << 2];

void build(int i, int l, int r) {
    sgt[i].l = l;
    sgt[i].r = r;
    if (l == r) {
        sgt[i].sum = a[l];
        return;
    }
    int mid = (l + r) >> 1;
    int k = i << 1;
    build(k, l, mid);
    build(k | 1, mid + 1, r);
    sgt[i].sum = sgt[k].sum + sgt[k | 1].sum;
}

void pushdown(int i) {
    if (sgt[i].lazy) {
        int k = i << 1;
        sgt[k].sum += sgt[i].lazy * (sgt[k].r - sgt[k].l + 1);
        sgt[k | 1].sum += sgt[i].lazy * (sgt[k | 1].r - sgt[k | 1].l + 1);
        sgt[k].lazy += sgt[i].lazy;
        sgt[k | 1].lazy += sgt[i].lazy;
        sgt[i].lazy = 0;
    }
    return;
}

void add(int i, int l, int r, int x) {
    if (sgt[i].l == l && sgt[i].r == r) {
        sgt[i].sum += x * (sgt[i].r - sgt[i].l + 1);
        sgt[i].lazy += x;
        return;
    }
    pushdown(i);
    int mid = (sgt[i].l + sgt[i].r) >> 1;
    int k = i << 1;
    if (r <= mid) add(k, l, r, x);
    else if (l > mid) add(k | 1, l, r, x);
    else add(k, l, mid, x), add(k | 1, mid + 1, r, x);
    sgt[i].sum = sgt[k].sum + sgt[k | 1].sum;
    return;
}

ll query(int i, int l, int r) {
    if (sgt[i].l == l && sgt[i].r == r)
        return sgt[i].sum;
    pushdown(i);
    int mid = (sgt[i].l + sgt[i].r) >> 1;
    int k = i << 1;
    if (r <= mid) return query(k, l, r);
    else if (l > mid) return query(k | 1, l, r);
    else return query(k, l, mid) + query(k | 1, mid + 1, r);
}

int main() {
    //freopen("in.txt", "r", stdin);
    //freopen("out.txt", "w", stdout);
    //ios_base::sync_with_stdio(0), cin.tie(0), cout.tie(0);
    scanf("%s", s + 1);
    n = strlen(s + 1);
    int cnt = 0;
    for (int i = 1; i <= n; i++) {
        int idx = s[i] - 'a';
        if (!num[idx]) {
            num[idx]++;
            cnt++;
        }
        a[i] = cnt;
    }
    for (int i = n; i >= 1; i--) {
        int idx = s[i] - 'a';
        if (!nxt[idx]) {
            nextAlpha[i] = nxt[idx] = i;
        } else {
            nextAlpha[i] = nxt[idx];
            nxt[idx] = i;
        }
    }
    nextAlpha[0] = 0;
    build(1, 1, n);
    ll ans = 0;
    for (int i = 0; i < n; i++) {
        if (nextAlpha[i] == i && i) {
            add(1, i + 1, n, -1);
            ans += query(1, i + 1, n);
        } else {
            int idx = nextAlpha[i];
            if (i + 1 <= idx - 1) {
                add(1, i + 1, idx - 1, -1);
            }
            ans += query(1, i + 1, n);
        }
    }
    printf("%lld\n", ans);
    return 0;
}
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值