题目有难度。字母转化为进制数+字符串转化为数字+哈希判定
大致题意为:给定一个字符串,并给定n和m,m表示该字符串中总共有m个不同的字符,现要求出所有长度为n的不同子串的长度。
分析如下:
1)最简单的做法就是利用map,枚举所有长度为n的字串,用map判定,若不存在则标记存在,并累计个数,否则检查下一个。但这样做当字串数目较大时,则明显会TLE。
2)其次是利用hash,哈希函数为hash(key)=∑str[[i] % prime。这个方法因该来说并没有起到时间上比较大的优化,同时,由于解决冲突,prime最好取1600M*10以内的最大素数,然后建立哈希表,这样的话很明显空间不够,而且根本没有用到m。
3)最后就是转化的思想。由于给定的字符串中有且仅有m个不同字符。故可以将所有字符转化为m进制中的对应的一个数(0、1、……m-1)。这样对于任意的子串都可以转化为一个m进制的数字,而且一一对应。这样利用hash表就可以直接判断了。由于对每一个字串都可以直接判断bool hash[]故很大的节省了时间开销。同时相对第二种方法也节省了不少空间开销。
下面是代码:10624K+235MS
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#define Max 10000100
#define Maxx 256 //字符ascii码,范围为0——255(包括非英文字符)
bool hash[Max]; // 哈希表
char str[Maxx*10000]; // 输入的字符串
int num[Maxx]; // 字符与其ascii码一一对应
int n,m;
int ans; //结果
int Power(int pow){ //求 m^pow
int result=1;
for(int i=0;i<pow;i++)
result*=m;
return result;
}
int main(){
scanf("%d%d",&n,&m);
memset(num,0,sizeof(num)); //初始化为0
memset(hash,0,sizeof(hash)); //初始化为false
getchar();
int pivot=0;
while(true){
char temp=getchar();
if(temp=='\n') // 遇到结束符退出
break;
str[pivot++]=temp; //记录字符
num[int(temp)]=1; //标记字符
}
int index=0; //将字符转化为进制数,从0开始
for(int i=0;i<Maxx;i++)
if(num[i]){ // 若字符存在
num[i]=index;
index++;
}
ans=0; // 不同个数初始化为0
for(int i=n-1;i<pivot;i++){//枚举所有长度为n的字符串
int key=0,point=Power(n-1); //求m^n-1,逆向为整数高位
for(int j=i;j>=i-n+1;j--){
key+=(num[int(str[j])]*point); // 累加,求得子字符串对应的m进制整数
point/=m;
}
if(!hash[key]){ //若不存在,则累加,并置标记为存在
ans++;
hash[key]=true;
}
}
printf("%d\n",ans); //输出结果
return 0;
}