PTA 7-46 新浪微博热门话题 (30 point(s))

新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。

本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。

输入格式:

输入说明:输入首先给出一个正整数N(≤105),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,输入保证#成对出现。

输出格式:

第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more ...,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。

注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。

输入样例:

4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic

结尾无空行

输出样例:

Hot
2
And 1 more ...

结尾无空行

#include <bits/stdc++.h>
using namespace std;

string process(string str){
    // 删除首尾空格
    str.erase(str.find_last_not_of(' ') + 1);
    str.erase(0, str.find_first_not_of(' '));
    // 删除中间多余空格
    string s;
    for(int i = 0; i < str.size(); i++){
        if(str[i] == ' ' && str[i+1] == ' ') continue;
        s += str[i];
    }
    return s;
}

main() {
    int n, Max = 0, others = 0;
    string weibo, topic;
    map<string, int> cnt;
    cin >> n;
    // getchar(); 因为后面会对非字母或数字处理 所以是否吃掉换行影响不大
    while(getline(cin, weibo)){
        int i = 0;
        // 重置话题标记
        map<string, bool> existed;
        
        while(i < weibo.size()){
            // 找到第一个'#' 从'#'后开始处理
            while(i < weibo.size() && weibo[i] != '#') i++;
            i++;
            // 直到指向下一个'#'为止 将字母字符转换成小写并连接起来 否则当成空格处理
            while(i < weibo.size() && weibo[i] != '#'){
                topic += (isalnum(weibo[i])) ? tolower(weibo[i]) : ' ';
                i++;
            }
            // 指向下一个字符 防止下一次循环时误判为第一个'#'
            i++;
            // 处理话题空格
            topic = process(topic);
            // 字符串非空 && 话题首次出现
            if(existed[topic] == false && topic.size() != NULL){
                existed[topic] = true;
                cnt[topic]++;
            }
            // 重置字符串
            topic.clear();
        }
    }
    
    for(auto it: cnt){
        Max = max(it.second, Max);
    }
    
    for(auto it: cnt){
        // 出现次数最多即热门话题
        if(Max == it.second){
            // 字母序输出第一个 统计总热门话题个数
            if(++others == 1){
                string hot = it.first;
                // 首字母大写
                hot[0] = toupper(hot[0]);
                cout << hot << endl << Max << endl;
            }
        }
    }
    // 另外几条热门话题的条数
    if(--others) cout << "And " << others << " more ...";
}

"找出被最多条微博提到的话题"根据这条件,我们统计的关于某个话题的微博数,而不是话题的出现次数。即便一条微博里面同样话题出现了N次,但由于在同一个微博里面,所以数量只加一。

处理字符串函数,删除末尾空格可以这样理解。find_last_not_of(" ") + 1先找到末尾空格的位置,然后用erase()函数将这个位置设为'\0',这不仅消去此处的空格,同时将后面多余的空格也一并删去,如下测试。

参考代码1        参考代码2        参考代码3         参考文章

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值