题目链接:https://leetcode.cn/problems/find-the-longest-substring-containing-vowels-in-even-counts/
题目大意:给出一个只含小写英文字母的字符串s[]
,求【其中所有元音字母出现次数都为偶数】的最长子串。
思路:这种和区间相关的应该是要用前缀和,但我没想出来怎么做。实际上要利用【奇偶性】和【状态压缩】。
状态压缩:对于一个字符串,其【元音字母出现的奇偶性】实际上可以用一串二进制掩码来表示,比如10010
表示aeiou
五个元音字母中,a
和o
出现了奇数次,其他出现偶数次。那么所有的状态数量也就2^5 = 32
种,用一个长度为32的数组firstPos[]
记录某一种状态status
首次出现的位置。
奇偶性:为什么需要记录【某一种状态status
首次出现的位置】呢?这是用到了奇偶性,因为合法的子串是所有元音字母出现次数都为偶数,即状态为00000
的子串。那么想要得到00000
,必须是两个【相同状态】的字符串相减得到。也就是某两个区间作差得到合法的区间。于是,firstPos[]
记录某一种状态status
首次出现的位置,当再一次出现相同的状态时,作差即可得到合法的子串长度。
为了方便使用前缀和的方法,我们让firstPos[0] = 0
,表示没有扫描任何字符的情况,于是下标从1
开始(下标1
表示扫描到了s[0]
)。从前往后扫描,如果出现了相同的状态,作差得到长度,并保留最长的长度。最后返回最长长度即可。
完整代码
class Solution {
public:
int findTheLongestSubstring(string s) {
int N = s.length();
int status = 0, ret = 0;
int firstPos[32];
memset(firstPos, -1, sizeof(firstPos));
firstPos[0] = 0;
for (int i = 0; i < N; i++) {
switch (s[i]) {
case 'a': status ^= 1 << 4;break;
case 'e': status ^= 1 << 3;break;
case 'i': status ^= 1 << 2;break;
case 'o': status ^= 1 << 1;break;
case 'u': status ^= 1 << 0;break;
default: ;
}
if (firstPos[status] != -1)
ret = max(ret, i + 1 - firstPos[status]);
else
firstPos[status] = i + 1;
}
return ret;
}
};