题目描述
给定一个字符串 s ,找出 至多 包含 k 个不同字符的最长子串 T。
示例 1:
输入: s = "eceba", k = 2
输出: 3
解释: 则 T 为 "ece",所以长度为 3。示例 2:
输入: s = "aa", k = 1
输出: 2
解释: 则 T 为 "aa",所以长度为 2。
算法分析
我们使用滑动窗口方法,使用两个指针 left 和 right 标记窗口的边界。
思路是将左右指针都设置为 0,然后向右移动 right 指针保证区间内含有不超过 k 个不同字符。当移动到含有 k + 1 个不同字符的时候,移动 left 指针直到区间内不含有超过 k + 1 个不同字符。
这个算法的基本思想是:在字符串上移动滑动窗口,保证窗口内有不超过 k 个不同字符,同时在每一步更新最大子串长度。
只有一个问题需要解决:如何移动左指针保证子串中只包含 k 个不同字符?
我们可以使用一个哈希表,建立从字符到滑动窗口最右出现位置的映射,在任意时刻,哈希表不能包含 k+1 个元素。
例如,使用哈希表可以知道字符 O 在 "LOVELEE" 窗口最右出现位置为 1,所以只需要将 left 指针移动到位置 1 + 1 = 2 保证将字符 O 排除在滑动窗口外。
代码
class Solution {
public:
int lengthOfLongestSubstringKDistinct(string s, int k) {
int n = s.length();
if(n < k) {
return n;
}
unordered_map<char, int> windows;
int left = 0, max_str = 0, kind = 0;
for(int right = 0; right < n; ++ right) {
if(windows[s[right]] == 0) {
++kind;
}
++windows[s[right]];
while(kind > k) {
--windows[s[left]];
if(windows[s[left]] == 0) {
--kind;
}
++left;
}
max_str = std::max(max_str, right - left + 1);
}
return max_str;
}
};
时间复杂度分析
对于最好情况,如果字符串不超过 k 个不同字符,答案是肯定的。因为只需要一次遍历就可以得到结果,时间复杂度是 O(N)。
对于最坏情况,当输入字符串包含 n 个不同字符,答案是不能。因为每一步都需要花费 O(k)时间找到哈希表中的最小值,所以总的复杂度是 O(Nk)。
时间复杂度:最好情况下是 O(N),最坏情况下是 O(Nk)。
空间复杂度:哈希表的空间开销:O(k)。