题意:
给定一个字符串,其中含有不同的字母数量为m,现在求这个字符串中有多少个长度为n且长的互不相同的字符子串,字符串的长度不会超过1600万。
举例:
n=3, m=4 ,字符串 "daababac". 长度为3的不同的子串分别是: "daa"; "aab"; "aba"; "bab"; "bac". 因此, 答案是5.
乍一看,直接map每一个长度为n的长度子串,然后mp.size()就是答案,然而TLE
其实用hash对每一个子串编号变成p进制数就可,而且很快
#include<iostream>
#include<algorithm>
#include<string>
#include<cstring>
#include<queue>
#include<map>
#include<vector>
#include<set>
#include<cstdio>
#include<cstring>
#define IOS ios::sync_with_stdio(false),cin.tie(0),cout.tie(0)
typedef long long ll;
using namespace std;
const int maxn = 1e7+7;
int vis[300];
char str[maxn];
int num[maxn]; //存储hash值
int n,m,len;
void solve()
{
ll ans = 0;
int cnt = 0;
for(int i = 1 ; i <= len ; i++){
if(!vis[str[i]]){
vis[str[i]] = ++cnt; //给每个字母编号
}
}
for(int i = 1 ; i <= len - n + 1; i++){
ll number = 0;
for(int j = 0 ; j < n ; j++){
number = number * cnt + vis[str[i + j]]; //变成cnt进制数
}
if(!num[number]){ //如果未出现,说明是新产生的
ans++;
num[number]++;
}
}
cout << ans << endl;
}
int main(){
IOS;
cin >> n >> m;
scanf("%s", str + 1);
len = strlen(str + 1);
solve();
return 0;
}