题目描述
解法
暴力法 + 剪枝
- 没有思路的时候就试试暴力法。也就是双层循环找到所有子串,然后对于每一个子串,统计元音个数,如果子串的元音个数都是偶数,则更新答案,最后返回最大的满足条件的子串长度即可。
- 这里我用了一个小的 trick。枚举所有子串的时候,我是从最长的子串开始枚举的,这样我找到一个满足条件的直接返回就行了(early return),不必维护最大值。这样不仅减少了代码量,还提高了效率。也就是所说的 “剪枝”
- 双层循环找出所有子串的复杂度是O(n^2),统计元音个数复杂度是O(n)
- 因此这种算法的时间复杂度为O(n^3),空间复杂是O(1)
- 分析发现,这样做其实有很多重复计算,于是就想到前缀和
前缀和
- [i:j] 是一个子串,它里面的元音出现次数要为偶数。变量有2个,找出所有 [i:j]要两层循环。可以利用“前缀和”,转为:[0:j]的元音次数 − [0:i−1] 对应的元音次数 == 偶数,变为求 [0,x]的元音次数,变量就只有 1 个了
- 我们知道同奇偶的数之差一定是偶数,比如奇数 - 奇数 = 偶数;偶数 - 偶数 = 偶数;
- 问题转化为求 [0,j] 的奇偶性 和 [0,i−1] 的奇偶性相等时,使得 j − i 最大的 i、j 组合
但本题不是一个元素,而是 aeiou 5 个元素,怎么将5个元素转化为 i、j 这样的 1 个元素表示 ?
- 我们使用 5 位的二进制来表示 5 个元音字母的奇偶性情况,用 0 表示偶数,1 表示奇数,其中最低位表示 a,然后依次是 e,i,o,u。比如 10110 则表示的是包含偶数个 a 和 o,奇数个 e,i,u
这个思想我第一次遇到是在学习汉明码的时候,我自己概括为当需要将多元变为一元,尤其是在元素仅有两个状态的时候,就可以用这种思想,转化为二进制的形式
举个例子:
- 二进制位 [11111]–>[11110]–>[11100]–>[11101]–>[11111] 的一个合理的字符串变化:aeiou --> aeioua -->aeiouae–>aeiouaea–>aeiouaeae
- 从11111 到11111,从 aeiou 到 aeiouaeae 这个过程中,多余出来的 aeae 为符合条件的字符串
- 因此,不断更新 res,来获得最大字符串长度
需要一个hash表,存储每个状态码对应的下标。当然因为我们状态码最长也就是 11111 = 31,所以只需要开一个 32 大小的数组就好了
class Solution {
public:
int findTheLongestSubstring(string s) {
vector<int> pre(32, INT_MAX);//长度32的哈希表,并初始化
pre[0] = -1;
const int len = s.size();
int state = 0, ans = 0;
for(int i = 0; i< len; i++)
{
switch(s[i])
{
case 'a':
state ^= 1;
break;
case 'e':
state ^= 2;
break;
case 'i':
state ^= 4;
break;
case 'o':
state ^= 8;
break;
case 'u':
state ^= 16;
break;
default:
break;
}
if(pre[state] == INT_MAX)
pre[state] = i;//为哈希表pre添加索引值标记
else
ans = max(ans, i - pre[state]);//即 j - i 的作用
}
return ans;
}
};
其中 pre[0] = -1 可以理解为,开始计算前,参照点在第一个字符之前,也就是 -1 的位置,此时 aeiou 个数均为0,即 00000 = 0