7-15 新浪微博热门话题 (30 分)
新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。
本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。
输入格式:
输入说明:输入首先给出一个正整数N(≤105),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#
中的内容均被认为是一个话题,输入保证#
成对出现。
输出格式:
第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more ...
,其中k
是另外几条热门话题的条数。输入保证至少存在一条话题。
注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。
输入样例:
4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic
输出样例:
Hot
2
And 1 more ...
几个坑点:
非字母数字要当成空格处理,连续空格当成一个,前导后续空格也需去掉
#include <bits/stdc++.h>
using namespace std;
map<string,int> ma;
set<string> se;
set<string>::iterator it;
map<string,int> ::iterator it2;
int main()
{
ios::sync_with_stdio(false);
int n;
string s;
cin>>n;
cin.ignore();
int max_=-1; //记录出现关键字的最多次数
while(n--)
{
getline(cin,s);
transform(s.begin(),s.end(),s.begin(),::tolower); //挺好用的
se.clear();
for(int i=0; i<s.size(); i++)
{
if(s[i]=='#')
{
int j;
string ss="";
for( j=i+1;; j++)
{
if(s[j]=='#')
break;
else if(isalnum(s[j]))
ss=ss+s[j];
else if(s[j]==' '&&ss=="") //去前导空格
continue;
else if(ss[ss.size()-1]==' ')//去连续空格
continue;
else
ss=ss+' ';
}
i=j;
int x=ss.size()-1;
while(ss[x]==' ') //去后续空格
x--;
if(x!=ss.size()-1)
ss=ss.substr(0,x+1);
se.insert(ss);
}
}
for(it=se.begin(); it!=se.end(); it++)
{
ma[*it]++;
max_=max(max_,ma[*it]);
}
}
int num=0;
string ss;
int flag=1;
for(it2=ma.begin(); it2!=ma.end(); it2++)
{
if(it2->second==max_&&flag)
{
ss=it2->first;
flag=0;
num++;
}
else if(it2->second==max_)
{
num++;
}
}
ss[0]=toupper(ss[0]);
cout<<ss<<endl;
cout<<max_<<endl;
if(num>1)
printf("And %d more ...",num-1);
return 0;
}