有一个明显的性质:如果子串(i,j)包含了至少k个不同的字符,那么子串(i,k),(j<k<length)也包含了至少k个不同字符。
因此对于每一个左边界,只要找到最小的满足条件的右边界,就能在O(1)时间内统计完所有以这个左边界开始的符合条件的子串。
寻找这个右边界,是经典的追赶法(尺取法,双指针法)问题。维护两个指针(数组下标),轮流更新左右边界,同时累加答案即可。
#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
typedef long long LL;
const int N = 1000005;
char str[N];
int vis[30];
int main()
{
int T, n, len;
cin>>T;
while(T--)
{
int cnt = 0;
int sum = 0;
scanf("%s%d", &str, &n);
LL result = 0;
len = strlen(str);
memset(vis, 0, sizeof(vis));
for(int i=0 ;i<len; i++)
{
if(!vis[str[i]-'a'])
sum++;
vis[str[i]-'a'] ++;
while(sum == n)
{
result += len-i;
vis[str[cnt]-'a']--;
if(!vis[str[cnt]-'a'])
{
sum--;
cnt++;
break;
}
cnt++;
}
}
cout<<result<<endl;
}
return 0;
}