最近更新的博客
- 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单
- 华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典
- 【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南
- 华为od机试,独家整理 已参加机试人员的实战技巧
本篇题解:查找舆情热词 or 热词排序
题目描述:
输入正整数topN和文章数M,正整数topN表示要找出来的出现频率最高的topN个字符串,M篇文章中每篇文章会有两个字符串,一个是标题字符串,一个是正文字符串,字符串间有空格,每个单词被空格隔开。
我们的目的就是把这M篇文章连标题带正文拆成一个个单词,然后统计这一堆单词出现频率最高的topN个。
统计规则:
标题中出现的词语频率系数为3,正文中出现的词语频率系数为1,返回的答案应该按照词语出现从高到低排序,当词语出现次数频率相同时,在标题中出现频率次数高的排在前面,如果仍然相同,则按照词语在标题中出现的先后顺序进行排序,如果仍相同,则按照词语在正文中出现的先后顺序进行排序,先出现的排在前面。
输入
输入:第一行输入为正整数topN和文章数M。然后由于每篇文章有标题和正文两行,因此后面有2*M行数据。从第二行起,按顺序处理每篇文章的标题串和正文串。
输出
出现频率topN高的单词,每个单词用 ‘ ’