天梯赛模拟赛 L2 —— 含茶量

含茶量

ChatGPT(全名:Chat Generative Pre-trained Transformer)近期成为网络讨论的热点话题之一。本题就请你根据某社交网络中发帖的情况,统计每个人帖子中含有 ChatGPT(不区分大小写)的数量(简称“含茶量”),找出最热衷于讨论这个话题的人,即含茶量排前三的人。

输入格式:

输入在第一行中给出正整数:N(≤104),为参加统计的帖子数量。
随后给出 N 条帖子的信息,每条格式为:第一行给出发帖人 ID,是一个长度不超过 10 位的非空数字串;第二行给出非空的帖子的内容,由不超过 140 个英文字母、数字、空格、标点(只包括 ?, 和 .)组成,以回车结束(回车不算在 140 字内)。

输出格式:

分三行输出含茶量最高的前三个 ID,及其含茶量。有并列时按 ID 的字典序递增输出;如果有含茶量的 ID 不到三个,那么有几个就输出几个,但含茶量为 0 的不要输出。数字间以 1 个空格分隔,行首尾不得有多余空格。
题目保证至少有一个输出。

输入样例:

5
1010
I am not interested in ChatGPT.
233
I am gonna talk about chatgpt, and Chatgpt, and CHATGPT
233
they are all ChatGPT
2
I am gonna talk about chatgpt, and Chatgpt, and CHATGPT
0002
chatgp, hatGPT and Chatppt, are they all ChatGPTs?

输出样例:

233 4
2 3
0002 1

144caa6b29704c919e1027a21d9e52b3.png

思路及注意点 

思路:

将内容中的所有字母都变为小写字母,然后用 "chatgpt" 在内容里find “含茶量”的个数,再使用哈希表将ID和对应的 “含茶量” 绑定,然后使用优先级队列解决 TopK 问题的思路建立小根堆找出 “含茶量” 最多的三个ID即可。

注意:

有可能一个ID会对应多个内容,需要将多个内容的含茶量加起来

使用 getline() 获取一个带空格的字符串之前要记得使用 getchar() 或 cin.ignore() 清空缓冲区,因为前面使用过了 cin,不清空缓冲区 getline 会直接读到 '\n' !

可以使用 transfrom 函数来操作字符串,使其中的大写字母全部变为小写字母。

transform(tmp2.begin(), tmp2.end(), tmp2.begin(), ::tolower); // 全部变小写	
transform(tmp2.begin(), tmp2.end(), tmp2.begin(), ::toupper); // 全部变大写

代码 

代码应该可以AC,但我不知道在哪提交,思路应该就是这样,没问题。 d

#include <iostream>
#include <string>
#include <algorithm>
#include <queue>
#include <unordered_map>
using namespace std;
string aim = "chatgpt";
int get_cnt(string s)
{
	string tmp = s;
	int cnt = 0;
	int index = 0;
	int n = s.size();
	while (index != -1)
	{
		index = tmp.find(aim);
		if (index != -1)
		{
			cnt++;
			tmp = tmp.substr(index + 1);
		}
	}
	return cnt;
}
struct cmp
{
	bool operator()(const pair<string, int>& p1, const pair<string, int>& p2)
	{
		if (p1.second == p2.second) return p1.first < p2.first;
		return p1.second > p2.second;
	}
};
int main()
{
	int n = 5;
	cin >> n;
	unordered_map<string, int> hash;
	priority_queue<pair<string, int>, vector<pair<string, int>>, cmp> q;
	while (n--)
	{
		string tmp1;
		cin >> tmp1; // Id
		string tmp2;
		// getchar();
		cin.ignore();
		getline(cin, tmp2);
		transform(tmp2.begin(), tmp2.end(), tmp2.begin(), ::tolower); // 全部变小写
		int cnt = get_cnt(tmp2);
		hash[tmp1] += cnt;
	} // 全部存在哈希表里了
	for (auto& e : hash)
	{
		q.push(e);
		if (q.size() > 3) q.pop();
	}
	// 此时剩下的就是最大的三个 
	vector<pair<string, int>> vp;
	while (q.size() > 0)
	{
		pair<string, int> tmp = q.top();
		q.pop();
		vp.push_back(tmp);
	}
	while (vp.size() > 0)
	{
		if(vp.back().second > 0)
			cout << vp.back().first << " " << vp.back().second << endl;
		vp.pop_back();
	}
	return 0;
}

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值