难度:简单
目录
一、问题描述
这里直接采用的是LeetCode上面的问题描述。
句子仅由小写字母('a' 到 'z')、数字('0' 到 '9')、连字符('-')、标点符号('!'、'.' 和 ',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。
如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:
- 仅由小写字母、连字符和/或标点(不含数字)。
- 至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab" 和 "ab-" 不是有效单词)。
- 至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾 。
这里给出几个有效单词的例子:"a-b."
、"afad"
、"ba-c"
、"a!"
和 "!"
。
给你一个字符串 sentence
,请你找出并返回 sentence
中 有效单词的数目 。
下面给出示例:
提示:
- 1 <= sentence.length <= 1000
- sentence 由小写英文字母、数字(0-9)、以及字符(' '、'-'、'!'、'.' 和 ',')组成
- 句子中至少有 1 个 token
二、思想
1、解题思想
使用哈希表来存储 token,这样碰到相同的 token 只需要判断一次,哈希表 结构如下:
unordered_map<string,int> hashTable; key值:string 存储 sentence 中空格隔开的 token;value值:int 存储 token 的个数。
接下来只要遍历 hashTable 中的 string进行判断 是否满足要求即可。
我将一个 token 分为三部分进行判断:
- 首先判断 token 第一个字符 是否是 数字('0' - '9')、 连字符('-')以及 标点符号('!'、'.' 和 ',')。
- 然后判断token 最后一个字符 是否是 数字('0' 到 '9') 以及 连字符('-')。
- 最后判断 token 中间的部分 是否有不满足要求的部分即:
1.是否有 标点符号('!'、'.' 和 ',')。
2.连字符 ‘-’ 左右是否是字母(‘a’-'z')。
3.是否包含数字('0' -'9')。
完成上述判断,即可确定一个token 是否是 有效单词。
最后统计其数量累加即可。
2、极端情况判断
- 这里哈希表存储 token 的时候会将空字符串 "" 存储进去。
- 单个符号 "."、","、"!" 也是 有效单词。
3、解决极端情况
- 判断 token == "" 的话 直接continue
- 判断 token == 单个字符的话 将其个数 累加到 有效单词个数中。
三、解题
1、代码实现
class Solution {
public:
int countValidWords(string sentence) {
unordered_map<string, int> hashTable;
string temp;
for (int i = 0; i < sentence.size(); i++) {
if (sentence[i] == ' ') {
hashTable[temp]++;
temp = "";
continue;
}
temp += sentence[i];
}
hashTable[temp]++;
int ans = 0;
for (auto item : hashTable) {
string token = item.first;
int tokenNumber = item.second;
bool flag = false;
if (token == "") {
continue;
}
//单个符号 也算有效单词
if (token == "," or token == "." or token == "!") {
ans += tokenNumber;
}
//判断 token 的首字符
if (token[0] == '-' or (token[0] >= '0' and token[0] <= '9') or token[0] == '!' or token[0] == '.' or token[0] == ',') {
continue;
}
//判断 token 的尾字符
if (token[token.size() - 1] == '-' or (token[token.size() - 1] >= '0' and token[token.size() - 1] <= '9')) {
continue;
}
int hyphen = 0;
//判断 token 的中间是否满足要求
for (int i = 1; i < token.size() - 1; i++) {
//统计 连字符个数
hyphen += token[i] == '-' ? 1 : 0;
//判断连字符 左右是否是 字母 'a'-'z'
if ((token[i] == '-' and (token[i + 1] > 'z' or token[i + 1] < 'a')) or
(token[i] == '-' and (token[i + 1] > 'z' or token[i + 1] < 'a')) ) {
flag = true;
break;
}
//判断是否是 数字,或者 标点
if ((token[i] >= '0' and token[i] <= '9') or token[i] == ',' or token[i] == '.' or token[i] == '!') {
flag = true;
break;
}
}
if (flag or hyphen > 1) {
continue;
}
ans += tokenNumber;
}
return ans;
}
};
2、时间复杂度 and 空间复杂度
时间复杂度:这里取最坏情况即 哈希表长度 n * 单个最长单词长度 i
空间复杂度:
四、总结
这一题主要是要理清思路,做好题目中的判断,以及将各个 token 提取保存下来即可。
如果对你有什么帮助,请star ♥ 一下,收藏一下,蟹蟹啦!👇👇