我们通过两道题进行介绍相关概念
- 题目一
对于这类题,如果我们暴力解答,也就是先求出所有子串的值然后分别进行统计,放平常的话,是一种方法。
但是,这类题,我们注意到字符串长度上限是n^5,按常规方法是肯定会有一些测试集超时而无法完全通过。
有一种巧妙的方法就是计算每个位置上的字母的贡献值然后进行相加。
这道题是统计不同字符的个数,相比于下道题简单些。
就是需要统计当前子串中,第一次出现的字母的个数。
我们需要思考一下,什么时候这个下标上的字母才能发挥它在这个题目中的对应作用呢。
便产生了一个区间:当前下标往前延伸是到前一次出现的下标,往后是到字符串末尾,在这个区间内才能产生它的贡献值
- 注:如果没有前一次字母,默认值是-1,应该能比较容易get到
此题贡献值的计算方法 : ( i下标 - 前一次出现相同字母的下标 ) * ( 字符串长度 - i下标)
#include<bits/stdc++.h>
using namespace std;
string str;
int pre[100001];
int where[26];
int main() {
cin >> str;
//填值,默认-1,当做前面没有出现过
fill(where, where+26, -1);
for(int i=0; i<str.length(); i++) {
//记录此下标上的字母的前一次出现的字母下标
pre[i] = where[str[i]-'a'];
//更新当前字母最后一次出现的下标
where[str[i]-'a'] = i;
}
long long sum=0;
for(int i=0; i<str.length(); i++) {
sum += (i-pre[i])*(str.length()-i);
}
cout << sum;
return 0;
}
- 题目二
此题是统计恰好出现一次的字符个数。要让当前字母能发挥作用,其子串中肯定不能包含相同字母
便产生了一个区间:i 当前下标往前延伸到前一次出现的下标,往后延伸到下一次出现的下标。
在这个区间内的子串才可能产生这个字母的贡献值 - 注:如果没有出现前一次,默认值为-1, 如果没有出现后一次,默认值为字符串长度,也就是末尾下标+1
此题贡献值计算方法: (i下标 - 前一次出现此字母的下标)* ( 最后一次出现该字母的下标 - i下标 )
#include<bits/stdc++.h>
using namespace std;
string str;
int pre[100001], next[100001], where[26];
int main() {
cin >> str;
//统计当前下标处字母的前一次出现的下标,默认是-1
fill(where, where+26, -1);
for(int i=0; i<str.length(); i++) {
pre[i] = where[str[i]-'a'];
//更新当前字母出现的下标
where[str[i]-'a'] = i;
}
//统计当前下标处字母的后一次出现的下标 ,默认是字符串长度
fill(where, where+26, str.length()) ;
//注意,需要从后往前进行统计
for(int i=str.length()-1; i>=0; i--) {
next[i] = where[str[i]-'a'];
//更新当前字母出现的下标
where[str[i]-'a'] = i;
}
//进行每个位置上的字母的贡献值计算并入总和
long long int sum=0;
for(int i=0; i<str.length(); i++) {
sum += (i-pre[i]) * (next[i]-i);
}
cout << sum << endl;
return 0;
}