Problem Description
lily的好朋友xiaoou333最近很空,他想了一件没有什么意义的事情,就是统计一篇文章里不同单词的总数。下面你的任务是帮助xiaoou333解决这个问题。
Input
有多组数据,每组一行,每组就是一篇小文章。每篇小文章都是由小写字母和空格组成,没有标点符号,遇到#时表示输入结束。
Output
每组只输出一个整数,其单独成行,该整数代表一篇文章里不同单词的总数。
Sample Input
you are my friend
Sample Output
4
思路
做法很多种字符串切分也很多种。但是每一种都离不开一个单词判重问题。
-
map + strtok函数切分单词或者stringstream流,最后直接输出map容器元素个数。
-
set + strtok函数切分单词或者stringstream流,最后直接输出set容器元素个数。
-
字典树做法,有点大材小用就当练习模板吧。单词结尾标记一下,最后直接遍历所有的pos位置,置为true的就是一个单词,加起来输出就可以。
#include <iostream>
#include <cstring>
#include <cstdio>
#include <algorithm>
#include <map>
#include <set>
using namespace std;
const int maxn = 100005;
int trie[maxn][26];
bool num[maxn];
int cnt;
void insert_s(char *s)
{
int root = 0;
int n = strlen(s);
for(int i = 0;i < n;i++){
int k = s[i] - 'a';
if(!trie[root][k]){
trie[root][k] = ++cnt;
}
root = trie[root][k];
}
num[root] = true;
}
int main()
{
char s[10005];
char del[] = " ";
while(gets(s)){
if(strcmp(s,"#") == 0){
break;
}
memset(trie,0,sizeof(trie));
memset(num,false,sizeof(num));
cnt = 0;
char *p = strtok(s,del);
while(p){
insert_s(p);
p = strtok(NULL,del);
}
int ans = 0;
for(int i = 1;i <= cnt;i++){
ans += num[i];
}
printf("%d\n",ans);
}
return 0;
}
愿你走出半生,归来仍是少年~