含茶量
ChatGPT(全名:Chat Generative Pre-trained Transformer)近期成为网络讨论的热点话题之一。本题就请你根据某社交网络中发帖的情况,统计每个人帖子中含有 ChatGPT
(不区分大小写)的数量(简称“含茶量”),找出最热衷于讨论这个话题的人,即含茶量排前三的人。
输入格式:
输入在第一行中给出正整数:N(≤104),为参加统计的帖子数量。
随后给出 N 条帖子的信息,每条格式为:第一行给出发帖人 ID,是一个长度不超过 10 位的非空数字串;第二行给出非空的帖子的内容,由不超过 140 个英文字母、数字、空格、标点(只包括 ?
、,
和 .
)组成,以回车结束(回车不算在 140 字内)。
输出格式:
分三行输出含茶量最高的前三个 ID,及其含茶量。有并列时按 ID 的字典序递增输出;如果有含茶量的 ID 不到三个,那么有几个就输出几个,但含茶量为 0 的不要输出。数字间以 1 个空格分隔,行首尾不得有多余空格。
题目保证至少有一个输出。
输入样例:
5
1010
I am not interested in ChatGPT.
233
I am gonna talk about chatgpt, and Chatgpt, and CHATGPT
233
they are all ChatGPT
2
I am gonna talk about chatgpt, and Chatgpt, and CHATGPT
0002
chatgp, hatGPT and Chatppt, are they all ChatGPTs?
输出样例:
233 4
2 3
0002 1
思路及注意点
思路:
将内容中的所有字母都变为小写字母,然后用 "chatgpt" 在内容里find “含茶量”的个数,再使用哈希表将ID和对应的 “含茶量” 绑定,然后使用优先级队列解决 TopK 问题的思路建立小根堆找出 “含茶量” 最多的三个ID即可。
注意:
有可能一个ID会对应多个内容,需要将多个内容的含茶量加起来
使用 getline() 获取一个带空格的字符串之前要记得使用 getchar() 或 cin.ignore() 清空缓冲区,因为前面使用过了 cin,不清空缓冲区 getline 会直接读到 '\n' !
可以使用 transfrom 函数来操作字符串,使其中的大写字母全部变为小写字母。
transform(tmp2.begin(), tmp2.end(), tmp2.begin(), ::tolower); // 全部变小写
transform(tmp2.begin(), tmp2.end(), tmp2.begin(), ::toupper); // 全部变大写
代码
代码应该可以AC,但我不知道在哪提交,思路应该就是这样,没问题。 d
#include <iostream>
#include <string>
#include <algorithm>
#include <queue>
#include <unordered_map>
using namespace std;
string aim = "chatgpt";
int get_cnt(string s)
{
string tmp = s;
int cnt = 0;
int index = 0;
int n = s.size();
while (index != -1)
{
index = tmp.find(aim);
if (index != -1)
{
cnt++;
tmp = tmp.substr(index + 1);
}
}
return cnt;
}
struct cmp
{
bool operator()(const pair<string, int>& p1, const pair<string, int>& p2)
{
if (p1.second == p2.second) return p1.first < p2.first;
return p1.second > p2.second;
}
};
int main()
{
int n = 5;
cin >> n;
unordered_map<string, int> hash;
priority_queue<pair<string, int>, vector<pair<string, int>>, cmp> q;
while (n--)
{
string tmp1;
cin >> tmp1; // Id
string tmp2;
// getchar();
cin.ignore();
getline(cin, tmp2);
transform(tmp2.begin(), tmp2.end(), tmp2.begin(), ::tolower); // 全部变小写
int cnt = get_cnt(tmp2);
hash[tmp1] += cnt;
} // 全部存在哈希表里了
for (auto& e : hash)
{
q.push(e);
if (q.size() > 3) q.pop();
}
// 此时剩下的就是最大的三个
vector<pair<string, int>> vp;
while (q.size() > 0)
{
pair<string, int> tmp = q.top();
q.pop();
vp.push_back(tmp);
}
while (vp.size() > 0)
{
if(vp.back().second > 0)
cout << vp.back().first << " " << vp.back().second << endl;
vp.pop_back();
}
return 0;
}