新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。
本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。
输入格式:
输入说明:输入首先给出一个正整数N(≤105 ),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,输入保证#成对出现。
输出格式:
第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more …,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。
注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。
输入样例:
4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic
输出样例:
Hot
2
And 1 more ...
解题思路:
题目描述得太复杂了,实际要求如下:
1、第一个有效字符转化为大写(有效字符指字母和数字)
2、所有无效字符都视为空格,多个空格则保留一个,前面和后面均不能带空格
3、符合上面两个条件了再比较大小,取答案就行了
代码:
#include<iostream>
#include<string>
#include<map>
using namespace std;
int main()
{
map<string,int>a,b;
int c,d,e,f,g,max=0,ans=0;
string h,j[200],k;
char i[150];
cin>>c;
getchar();
while(c--)
{
getline(cin,h);
f=0;
for(d=0;d<h.size();d++)
{
e=0;
g=0;
if(h[d]=='#')
{
while(++d)
{
if(h[d]=='#')break;
if(h[d]>='0'&&h[d]<='9'||h[d]>='a'&&h[d]<='z'||h[d]>='A'&&h[d]<='Z')
{
if(e==0&&h[d]>='a'&&h[d]<='z')
h[d]+='A'-'a';
i[e++]=h[d];
g=1;
}
else if(e!=0&&g)//将其它字符都视为空格
{
i[e++]=' ';
g=0;
}
}
if(i[e-1]==' ')e--;//如果最后一个是空格则删掉
i[e]='\0';
j[f]=i;
if(b[j[f]]==0)//控制单句不重复计算
{
b[j[f]]=1;
a[j[f]]++;
}
f++;
}
}
while(f--)//条件重置
b[j[f]]=0;
}
map<string,int>::iterator it;
for(it=a.begin();it!=a.end();it++)//遍历搜索答案
{
if(max<it->second)
{
max=it->second;//出现的最大微博数
k=it->first;
ans=0;//同样次数的条数,置零
}
else if(max==it->second)//同样次数的条数
ans++;
}
cout<<k<<endl<<max<<endl;
if(ans)
cout<<"And "<<ans<<" more ..."<<endl;
}