Given a string, find the length of the longest substring without repeating characters.
给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。
Example 1:
Input: "abcabcbb"
Output: 3
Explanation: The answer is "abc"
, with the length of 3.
Example 2:
Input: "bbbbb"
Output: 1
Explanation: The answer is "b"
, with the length of 1.
Example 3:
Input: "pwwkew" Output: 3 Explanation: The answer is"wke"
, with the length of 3. Note that the answer must be a substring,"pwke"
is a subsequence and not a substring.
方法一:暴力法
题目更新后由于时间限制,会出现 TLE。
思路:
逐个检查所有的子字符串,看它是否不含有重复的字符。
算法
1. 枚举给定字符串的所有子字符串:我们需要枚举它们开始和结束的索引。假设开始和结束的索引分别为 i 和 j。那么我们有 0 <= i < j <= n. 因此使用 i 从 0 到 n-1 ,以及 j 从 i+1 到 n 这两个嵌套循环,就可以枚举出字符串 s 的所有子字符串。
2. 检查每一个子字符串是否含有重复字符:可以使用集合。我们遍历字符串中的所有字符,并将它们逐个放入 set 中。在放置一个字符之前,我们检查该集合是否已经包含它。如果包含,我们会返回 false。循环结束后,我们返回 true。
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length();
int ans = 0;
for (int i = 0; i < n; i++)
for (int j = i + 1; j <= n; j++)
if (allUnique(s, i, j)) ans = Math.max(ans, j - i);
return ans;
}
public boolean allUnique(String s, int start, int end) {
Set<Character> set = new HashSet<>();
for (int i = start; i < end; i++) {
Character ch = s.charAt(i);
if (set.contains(ch)) return false;
set.add(ch);
}
return true;
}
}
复杂度分析:
- 时间复杂度:O(n^3)
- 空间复杂度:O(min(n, m))
方法二:滑动窗口
算法:
第一种暴力法很简单,但是太慢了,如下进行优化。
在暴力法中,我们会反复检查一个字符串是否含有重复的字符,这是没有必要的。如果索引 i 到 j-1 的子字符串 s_ij 已经被检查没有重复字符,我们只需要检查 s[j] 对应的字符是否在 子字符串 s_ij 中。
但要检查 s[j] 对应的字符是否在 子字符串 s_ij 中,会产生 O(n^2) 的算法,进一步优化如下:
使用 HashSet 作为滑动窗口存储当前子字符串 [i,j), (最初 i=j=0), 然后我们向右滑动索引 j, 如果 j 不在滑动窗口中,继续向右滑动 j, 直到 s[j] 存在于滑动窗口中,将 i 向右移动,并移除对应的 s[i], 直到 s[j] 不存在于滑动窗口中,在过程中找出 j-i 的最大值即为所求。
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length();
Set<Character> set = new HashSet<>();
int ans = 0, i = 0, j = 0;
while (i < n && j < n) {
// try to extend the range [i, j]
if (!set.contains(s.charAt(j))){
set.add(s.charAt(j++));
ans = Math.max(ans, j - i);
}
else {
set.remove(s.charAt(i++));
}
}
return ans;
}
}
复杂度分析:
- 时间复杂度 O(2n)=O(n), 最糟糕情况下,每个字符将被 i 和 j 访问两次
- 空间复杂度 O(min(n,m)), m 表示字符集大小
方法三:优化的滑动窗口
上述的方法最多需要执行 2n 个步骤,可被进一步优化为 n 个步骤。定义字符到索引的映射,而不是使用一个集合来判断一个字符是否存在。当我们找到重复字符时,可以立即跳过该窗口。
即就是,如果 s[j] 在 [i,j)中有重复字符k, 我们不需要逐渐增加i, 而是直接跳过 [i, k] 中的元素,并将 i 变为 k+1.
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length(), ans = 0;
Map<Character, Integer> map = new HashMap<>(); // current index of character
// try to extend the range [i, j]
for (int j = 0, i = 0; j < n; j++) {
if (map.containsKey(s.charAt(j))) {
i = Math.max(map.get(s.charAt(j)), i);
}
ans = Math.max(ans, j - i + 1);
map.put(s.charAt(j), j + 1);
}
return ans;
}
}
当我们知道字符集比较小时,可以使用一个整数数组作为直接访问表来替换 Map。
常用表如下:
- int [26] 用于字母 ‘a’ - ‘z’ 或 ‘A’ - ‘Z’
- int [128] 用于ASCII码
- int [256] 用于扩展ASCII码
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length(), ans = 0;
int[] index = new int[128]; // current index of character
// try to extend the range [i, j]
for (int j = 0, i = 0; j < n; j++) {
i = Math.max(index[s.charAt(j)], i);
ans = Math.max(ans, j - i + 1);
index[s.charAt(j)] = j + 1;
}
return ans;
}
}
复杂度分析:
- 时间:O(n), 索引 j 迭代 n 次
- 空间(HashMap): O(min(n,m))
- 空间(Table):O(m)