PTA 7-46 新浪微博热门话题

本文介绍了一种简化版的热门话题推荐功能,通过解析大量英文微博,提取出被最多条微博提及的话题,以支持中文微博平台如新浪微博的功能。
摘要由CSDN通过智能技术生成

新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。

本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。

输入格式:

输入说明:输入首先给出一个正整数N(≤105),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,输入保证#成对出现。

输出格式:

第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more ...,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。

注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。

输入样例:

4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic

输出样例:

Hot
2
And 1 more ...

代码:

#include<iostream>
#include<map>
#include<vector>
#include<cstdio>
#include<cstring>
using namespace std;
map<string, int> m; //存放次数
int main()
{
    int N;
    cin >> N;
    char s[145];
    cin.getline(s, 145);
    map<string, int>::iterator it;
    for (int k=0;k<N;k++)
    {
        cin.getline(s, 145);
        int len = strlen(s);
        string str="";
        int i = 0;
        map<string, int> jud;
        for (int i = 0; i < len; i++)  //对输入字符串进行遍历
        {
            if (s[i] == '#')  //找到开头的#
            {
                str.clear();
                i++;
                while(s[i]==' ') i++; //去除话题前面的空格
                int j = 0;
                while (s[i] != '#' && i < len) //遍历至结尾的#
                {
                    if (s[i] >= 'A' && s[i] <= 'Z')
                        s[i] = s[i] - 'A' + 'a'; //处理成小写
                    if (!((s[i] >= '0' && s[i] <= '9') || (s[i] >= 'a' && s[i] <= 'z')))
                        s[i] = ' ';  //处理非数字和子母
                    if(s[i+1]=='#'&&s[i]==' ') break; //如果空格位于话题的最后,则省略
                    str += s[i++];
                }
                if (i == len) break; //没有结尾的#,则跳出本次字符串的扫描
                it = jud.find(str);
                if (it != jud.end())  //该话题已经出现过一次,则不再增加次数
                {
                    jud[str]++;
                }
                else
                {
                    jud[str]++;
                    m[str]++; //次数加一
                }
            }
        }
    }
    int max = 0;
    string str = "";
    for (it = m.begin(); it != m.end(); it++) //对话题遍历
    {
        if (it->second > max)
        {
            max = it->second;
            str = it->first;
        }
    }
    int sum = 0; //并列的微博话题
    for (it = m.begin(); it != m.end(); it++)
    {
        if ((max == it->second) && (str != it->first))
        {
            sum++;
            if (str > it->first)
                str = it->first; //输出字母最小的话题
        }
    }
    str[0] = str[0] - 'a' + 'A'; //首字母大写
    cout << str << endl << max << endl;
    if (sum)
        cout << "And " << sum << " more ...";
}

  • 15
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值