题目描述
“八一三”淞沪抗战爆发后,***几次准备去上海前线视察和指挥作战。但都因为宁沪之间的铁路和公路遭到了敌军的严密封锁,狂轰滥炸,一直未能成行。
***特科组织,其主要任务是保卫***的安全,了解和掌握敌方的动向。经过一段时间的监听,谍报组获取了敌方若干份密报,经过分析,发现密文中频繁出现一些单词,情报人员试图从单词出现的次数中,推出敌军的行动计划。
请你编程,快速统计出频率高的前十个单词。
输入
密文是由英语单词(小写字母)组成,有若干段。单词之间由一个或多个空格分开,自然段之后可以用一个“,”或“。”表示结束。整个内容的单词数量不超过10000,不同的单词个数不超过500.
输出
输出占10行,每行一个单词及出现的次数,中间一个空格。要求按频率降序输出,出现次数相同的单词,按字典序输出。
样例输入
shooting is at shanghai station. shooting must be carried out. shooting shooting.shanghai station must be surrounded, at least a team of one hundred soldiers to fight. twenty five soldiers shooting in the north, twenty five soldiers shooting in the south, twenty five soldiers shooting in the east, twenty five soldiers shooting in the west.
样例输出
shooting 8soldiers 5five 4in 4the 4twenty 4at 2be 2must 2shanghai 2
这道题易错的地方在于输入时候以文件形式结束(!=EOF),输入测试结果时候以ctrl+z结束。
下面是代码:
#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <map>
#include <string.h>
using namespace std;
struct node
{
char str[100]; //记录单词
int count; //记录个数
}word[1000];
int N=0;
int cmp(node w1,node w2)
{
if(w1.count!=w2.count)
return w1.count>w2.count;
else
{
int a=strcmp(w1.str,w2.str);
if(a>0)
return 0;
else
return 1;
}
}
int main()
{
map <string,int> m;
map <string,int>::iterator it; //用map只是为了计个数好计
char str[100];
while(scanf("%s",str)!=EOF)
{
int len=strlen(str);
if(str[len-1]==','||str[len-1]=='.') //去除多余符号
str[len-1]='\0';
string s=str;
m[s]++;
}
for(it=m.begin(); it!=m.end(); it++) //将map中的单词和次数转存到结构体
{ //(本人不知道怎么用map直接输出要求答案所以麻烦了点)
string s=(*it).first;
int count=(*it).second;
strcpy(word[N].str,s.c_str());
word[N++].count=count;
}
sort(word,word+N,cmp); //排序
for(int i=0; i<10; i++)
{
printf("%s %d\n",word[i].str,word[i].count);
}
return 0;
}