微信改版,加星标不迷路!
每日一算法-最常见的单词
给定一个段落 (paragraph) 和一个禁用单词列表 (banned)。返回出现次数最多,同时不在禁用列表中的单词。题目保证至少有一个词不在禁用列表中,而且答案唯一。
禁用列表中的单词用小写字母表示,不含标点符号。段落中的单词不区分大小写。答案都是小写字母。
示例:
输入: paragraph = "Bob hit a ball, the hit BALL flew far after it was hit." banned = ["hit"]
输出: "ball"
解释: "hit" 出现了3次,但它是一个禁用的单词。"ball" 出现了2次 (同时没有其他单词出现2次),所以它是段落里出现次数最多的,且不在禁用列表中的单词。
注意,所有这些单词在段落里不区分大小写,标点符号需要忽略(即使是紧挨着单词也忽略, 比如 "ball,"), "hit"不是最终的答案,虽然它出现次数更多,但它在禁用单词列表中。
说明:
1 <= 段落长度 <= 1000
.1 <= 禁用单词个数 <= 100
.1 <= 禁用单词长度 <= 10
.答案是唯一的, 且都是小写字母 (即使在
paragraph
里是大写的,即使是一些特定的名词,答案都是小写的。)paragraph
只包含字母、空格和下列标点符号!?',;.
不存在没有连字符或者带有连字符的单词。
单词里只包含字母,不会出现省略号或者其他标点符号。
解析
? 将paragraph进行以下处理:将所有的标点符号换为空格
? 统计除了banned之外出现的单词个数,最后取个数最多的单词
实现代码
class Solution {
public:
string mostCommonWord(string p, vector<string>& banned) {
unordered_set<string> ban(banned.begin(), banned.end());
unordered_map<string, int> count;
for (auto & c: p){
//printf("%c\n",c);
c = isalpha(c) ? tolower(c) : ' ';
}
//printf("%s",p.c_str());
istringstream iss(p);
string w;
pair<string, int> res ("", 0);
while (iss >> w)
if (ban.find(w) == ban.end() && ++count[w] > res.second)
res = make_pair(w, count[w]);
return res.first;
}
};
需要注意的地方
for (auto & c: p){
c = isalpha(c) ? tolower(c) : ' ';
}
这段代码的作用是将标点符号全部置为空格。isalpha的作用是判断是否为字母,tolower的作用是将字母全部转为小写。
istringstream iss(p);
string w;
pair<string, int> res ("", 0);
while (iss >> w)
if (ban.find(w) == ban.end() && ++count[w] > res.second)
res = make_pair(w, count[w]);
return res.first;
"isstringstream"变量和 ">>" 一起使用,目的是挨个取出paragraph中的单词,然后通过ban,find()判断是否在禁忌表中,如果满足不再禁忌表中,则将该单词的计数器+1。遍历完paragraph之后,返回结果即可。
今日问题
朋友们圣诞节快乐哈,今天给大家发一下福利。
今天大家谈一下你最想要哪一本书?理由是什么?
打卡格式:打卡第n天,答:...