题目:给一个字符串,问有多少个子串至少含有k个不同的字母?
有一个明显的性质:如果子串(i,j)包含了至少m个不同的字符,那么子串(i,k),(j<k<length)也包含了至少m个不同字符。
因此对于每一个左边界,只要找到最小的满足条件的右边界,就能在O(1)时间内统计完所有以这个左边界开始的符合条件的子串。
寻找这个右边界,是经典的追赶法(尺取法,双指针法)问题。维护两个指针(数组下标),轮流更新左右边界,同时累加答案即可。
#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn = 1000005 ;
char str[maxn] ;
int vis[100] ;
int m ;
int main()
{
int t ;
scanf("%d",&t) ;
while(t--)
{
scanf("%s%d",str,&m) ;
int n = strlen(str);
memset(vis,0,sizeof(vis));
int flag = 0 ; //指向后面的下标
int num = 0 ; //不同字符的个数
long long ans = 0 ;
for(int i = 0 ; i < n ; i++)
{ //计算每个以str[i]为开始字符的子串是否满足条件
while(num<m&&flag<n)
{
vis[str[flag]-'a']++ ;
if((vis[str[flag]-'a'])==1)num++;
flag++;
}
if(num==m)ans += n - flag + 1 ;
vis[str[i]-'a']-- ;
if((vis[str[i]-'a'])==0)num--;
}
printf("%I64d\n",ans) ;
}
return 0 ;
}