Greeting!今天介绍一道热度很高的题目:
无重复最长子串leetcode-cn.com个人认为属于中等题目中偏下的题目,比较容易用暴力解法完成,重点在于后面的滑动窗口思想与优化。(赶时间的同学直接跳到第二第三个副标处)
方法一:暴力解法
因为只需要判断连续的子字符串有没有重复的元素,很容易想到用Set集合里面的HashSet对象,利用一个index索引来遍历字符串。
- 如果没有重复元素,将元素加入Set集合中。
- 如果有重复元素,回退到重复元素较早的那个索引+1处的位置,直至索引到头。
- 最后比较哪个HashSet对象里面的元素最多即可。
代码如下:
public static int lengthOfLongestSubstring(String s) {
Set set = new HashSet();
int index = 0; //String s的索引
int maxSize = 0; //返回的值
while (index < s.length()) {
while (true) {
char c = s.charAt(index);
if (set.contains(c)) {
index = index - set.size() + 1;//index回退到重复元素的后一个位置(不可以用indexOf)
break;
} else {
set.add(c);//元素与set集合里面的不重复,添加到set里
index++;
}
if (index == s.length()) {
break;
}
}
if (maxSize < set.size()) { //找出每次遍历中set最大的元素,即最大不重复子串
maxSize = set.size();
}
set.clear(); //每次有重复元素,重置set集合
}
return maxSize;
}
注意code里面提到不可以用indexOf方法是因为如果字符串里有三个及以上相同的字符,例如'abcabcaa',indexOf只会返回到第一个'a'处,导致死循环。
方法二:滑动窗口法
望文生义,就是生成一个滑动窗口,也是利用HashSet作为这个窗口。如图所示:
首先,i和j分别代表窗口的左边界和右边界,最大不重复子串的值就是这个窗口能达到的最大值。
判断j++处的字符是否在窗口中,如果没有,就加入窗口中,并j+1(j++表示先用j的值,再将j+1)。
随着j继续增加,我们发现有重复的值在窗口中了,就不断地减少窗口,即令i++,直到窗口中没有重复元素为止(在这之前记录窗口大小曾经达到过的最大值)。
重复以上步骤,直至j到头为止。这里窗口曾经到达的最大值为3,所以返回3。
对应代码如下:
public static int lengthOfLongestSubstring(String s) {
int n = s.length();
Set set = new HashSet();
int maxSize = 0, i = 0, j = 0;
while (i < n && j < n) {
if (!set.contains(s.charAt(j))) {
set.add(s.charAt(j++));//注意j++和j+1不是同一个意思
maxSize = Math.max(maxSize, j - i);//更新窗口最大值
} else {
set.remove(s.charAt(i++));
}
}
return maxSize;
}
方法三:滑动窗口优化版
我们发现上述的方法最多需要执行 2n 个步骤(例如 'aaaaaa'的情况 ),我们可以进一步优化为最多执行n个步骤。
方法: 定义一个字符到索引的映射(好用的HashMap),而不是使用Set集合来判断一个字符是否存在。 当我们找到重复的字符时,我们可以立即跳过重复字符前的窗口。
例如这种情况时,其实不用再逐一将i++(逐渐缩小窗口),可以直接跳过b和c,i直接到达重复元素a所在的地方,讨论a以后的情况。
这时,我们最需要知道的就是重复字符与字符在字符串中的位置(索引),谈到映射就不得不请出好用的HashMap,代码如下所示:
public int lengthOfLongestSubstring(String s) {
int n = s.length(), ans = 0;
Map<Character, Integer> map = new HashMap<>();
for (int j = 0, i = 0; j < n; j++) {
if (map.containsKey(s.charAt(j))) {
i = Math.max(map.get(s.charAt(j)), i);//i直接跳到最新重复元素的位置
}
ans = Math.max(ans, j - i + 1);//更新窗口最大值
map.put(s.charAt(j), j + 1);//更新map中记录的重复元素的索引位置
}
return ans;
}
注意:第七行中i = Math.max(map.get(s.charAt(j)), i); 取其中最大值是因为之前这样操作时可能会跳过一些元素,而被跳过的元素还在Map中,即Map中放的不全是当前窗口里的元素,put只更新了重复元素的位置。这时containsKey()==true对当前窗口来说是错的,无需改变i。可用序列cbabcb分析,这里不再赘述。