力扣819 最常见的单词
给定一个段落 (paragraph) 和一个禁用单词列表 (banned)。返回出现次数最多,同时不在禁用列表中的单词。
题目保证至少有一个词不在禁用列表中,而且答案唯一。
禁用列表中的单词用小写字母表示,不含标点符号。段落中的单词不区分大小写。答案都是小写字母。
思路
题目思路不难,使用python可以轻松完成,但是使用cpp略有难度
需要将段落按照标点与空格进行分词,然后统计出现个数,并排除被ban的单词
代码
因为抄的答案所以集成度非常高,是个思路
- 使用哈希集合unordered_set可以用count()寻找是否出现某一具体单词
- cpp自带一个函数isalpha(char)可以判断是否是字母,正常使用应该
#include <cctype>
但力扣就算了;同样tolower()函数也在该头文件中
class Solution {
public:
string mostCommonWord(string paragraph, vector<string>& banned) {
unordered_set<string> bannedSet;
for (auto & word : banned) {
bannedSet.emplace(word);
}
int maxFrequency = 0;
unordered_map<string, int> frequencies;
string word;
int length = paragraph.size();
for (int i = 0; i <= length; i++) {
if (i < length && isalpha(paragraph[i])) {
word.push_back(tolower(paragraph[i]));
} else if (word.size() > 0) {
if (!bannedSet.count(word)) {
frequencies[word]++;
maxFrequency = max(maxFrequency, frequencies[word]);
}
word = "";
}
}
string mostCommon = "";
for (auto &[word , frequency] : frequencies) {
if (frequency == maxFrequency) {
mostCommon = word;
break;
}
}
return mostCommon;
}
};