2014-07-18题目
boj408. 字符串
时间限制 2000 ms
内存限制 512000 KB
题目描述
维护一个字符串集合:初始为空,依次处理一些插入操作,并在插入之后输出该字符串在集合中出现的次数。
字符串的长度不超过100,字符串个数不超过100000。
输入格式
输入文件包含若干行,每行为一个字符串,依次代表一个待插入的字
符串。该字符串一定非空,且仅包含英文字母和数字。
输出格式
对于每个插入操作输出一行一个整数,代表插入该字符串之后,该字
符串在集合中出现的次数。
输入样例
str1
str2
str1
str1
str2
str3
输出样例
1
1
2
3
2
1
这道题目一开始傻死了,直接去比较字符串,其实呢,对于一个字符串集合,进行查找,最好的就是hash了,这样会比较快速高效
不过hash做题有这么以下几点:
1.散列值;我们将字符串处理成散列值需要一个函数,在我的收藏中,就有一些大牛整理的一些散列函数,这个知道的越多越好。
2.存储;散列之后,你需要将他们依依存储下来,除以一个大素数是个很不错的选择
3.冲突处理:这绝对是hash的精髓,方法忒多并各有所长,学艺不精,这里只会先用链表存储相连,不知哪只大咖说过,链表让很多事情有法可解。不过同学有用vector的,我这是写的c,没法用啦
#include
#include
typedef unsigned long long int _a;
/**
我用“gather”数组去记录hash值,其中:nem记录字符串转换后的散列值
num记录该字符串出现数目;next记录冲突字符串位置;
*/
typedef struct gather
{
_a nem;
int num;
struct gather* next;
}gather;
gather stri[100193];
int main()
{
char strtest[105];
_a atest1=1;
int i,atest2=0;
gather* qi;
/**
初始化处理,这个nem千万不要乱赋值啊,他可是恒为正的啊!!!
*/
for(i=0;i<100193;i++){
stri[i].nem=0;
stri[i].num=0;
stri[i].next=NULL;
}
while(~scanf("%s",strtest)){
atest1=0;
for(i=0;i<(int)strlen(strtest);i++){
/*这就是散列函数*/
atest1 =(atest1*271+ strtest[i] - '0');
}
atest2=atest1%100193;/*对它取余求值*/
/**我习惯将调试输出对顶写,这样主要是为了好找*/
//printf("atest1=%u\n",atest1);
//printf("atest2=%d\n",atest2);
qi=&stri[atest2];
while(qi!=NULL){
if(qi->nem==0||(qi->nem==atest1)){
qi->num+=1;
qi->nem=atest1;/**这步我忘了,然后我就死了。。。能知道为什么吧*/
break;
}
else{
if(qi->next==NULL){
qi->next=malloc(sizeof(gather));qi=qi->next;
qi->nem=atest1;
qi->num=1;
qi->next=NULL;
break;
}
else qi=qi->next;
}
}
printf("%d\n",qi->num);
}
return 0;
}