1、题目
给你一个字符串 paragraph 和一个表示禁用词的字符串数组 banned ,返回出现频率最高的非禁用词。题目数据 保证 至少存在一个非禁用词,且答案 唯一 。
paragraph 中的单词 不区分大小写 ,答案应以 小写 形式返回。
示例 1:
输入:paragraph = “Bob hit a ball, the hit BALL flew far after it was hit.”, banned = [“hit”]
输出:“ball”
解释:
“hit” 出现了 3 次,但它是禁用词。
“ball” 出现了两次(没有其他单词出现这么多次),因此它是段落中出现频率最高的非禁用词。
请注意,段落中的单词不区分大小写,
标点符号会被忽略(即使它们紧挨着单词,如 “ball,”),
并且尽管 “hit” 出现的次数更多,但它不能作为答案,因为它是禁用词。
示例 2:
输入:paragraph = “a.”, banned = []
输出:“a”
2、解
先通过set对禁用词进行存储,方便后续查找;再遍历目标字符串是否是字母,如果是大写字母转化为小写,并存储在临时变量word中,如果word长度大于0,表示是一个完整的单词,则对该单词进行判断是否是禁用词,若不是禁用词,再将其存储在一个map中,并随时记录单词出现的最大次数值;最后再在map中寻找出现次数最大值对应的word,即为最常见的单词。
string mosCommonWord(string paragraph, vector<string> &banned){
unordered_set<string> bannedWords;
for(auto word : banned){
bannedWords.emplace(word);
}
unordered_map<string, int> wordStatistics;
string word = "";
int maxAppear = 0;
for(int i = 0; i < paragraph.length(); i++)
{
if(isalpha(paragraph[i]))
{
word.push_back(tolower(paragraph[i]));
}else if(word.size() > 0){
if(!bannedWords.count(word)){
wordStatistics[word]++;
maxAppear = max(maxAppear, wordStatistics[word]);
}
word.clear();
}
}
for(auto &[w, num] : wordStatistics){
if(num == maxAppear)
{
word = w;
break;
}
}
return word;
}