力扣算法题《无重复字符的最长字串》的思考和详解
一.问题描述
给定一个字符串 s ,请你找出其中不含有重复字符的 最长子串 的长度。
示例 1:
输入: s = “abcabcbb”
输出: 3
解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。
示例 2:
输入: s = “bbbbb”
输出: 1
示例 3:
输入: s = “pwwkew”
输出: 3
示例 4:
输入: s = “”
输出: 0
详见链接: 无重复字符的最长字串.
1.这道题的思考
首先拿到这道题,以“abcabcbb”字符串为例,第一步,首先要定义一个变量i,从头遍历至尾部,需要一个循环。
第二步,还需要定义一个变量j,在i的基础上往后移动,表示向后移动j位,此时站的位置是s[i+j],又是一个循环,怎么保证向后移动j位后(新加入一个字符),i到i+j之间的字符串没有与第j个字符重复呢?
第三步,还需要一个变量k,从i循环到i+j-1,观察是否有和j相同的字符。
至此这道题的思路就比较明确了,总共需要三层循环。
2.步骤一
int i=0; //从左边第一个开始遍历
while(s[i]){ //当第i个字符串不为空
/*中间的操作*/
i++;
}
3.步骤二
int j = 1; //j在i的基础上加1,就是从i后面一位开始走
while(s[i+j]){
/*中间的操作*/
if(有重复)//如果有重复字符,
break;//就跳出这个循环,这一位没用,j也没必要再加,去步骤一加i,再开始下一轮j的遍历
j++;
}
4.步骤三
int k = 0, flag = 0;//从第i位开始,与新加入的第i+j位判断,所以初始化0
while(k < j){//只判断i到i+j之间的字符
if(s[i+j] == s[i+k]){ //相等就退出循环
flag = 1;//有重复字符的标志
break;
}
k++;//否则继续往后搜寻
}
5.合并
int i = 0, len = 0;
while(s[i]){
int j = 1;
while(s[i + j]){
int k = 0, flag = 0;
while(k < j){
if(s[i + j] == s[i + k]){
flag = 1;
break;
}
k++;
}
if(flag)
break;
j++;
}
if(j > len)
len = j;
i++;
}
return len;
6.运行结果
真够拉跨的,用时太长了,内存倒还好。现在想想我们的程序有没有优化的地方?
二.滑动窗口优化
1.滑动窗口解释
根据题目解答的描述,设定一个窗口,窗口左边下标为i,右边下标为j,初始肯定为i=j=0,窗口只有第一个字符。
第一步,把j向右移动,判断这个j和窗口里面的字符(i ~ j-1)有没有相同的,如果没有继续右移动。(注意这里的j和上一张不一样了,这个j是窗口的右边界,上一章的j是相对与i,向右走j步)。
第二步,如果上一步有重复的,来这里:把i向右移动一位,再次判断窗口内有没有和第j位重复的,如果有,i继续右移,直到没有重复位,跳出循环。
第三步,跳出以后,就可以取长度了,len=max(max, j-i+1)。然后继续步骤一。
2.程序
复制力扣的官方解答。
// 哈希集合,记录每个字符是否出现过
unordered_set<char> occ;
int n = s.size();
// 右指针,初始值为 -1,相当于我们在字符串的左边界的左侧,还没有开始移动
int rk = -1, ans = 0;
// 枚举左指针的位置,初始值隐性地表示为 -1
for (int i = 0; i < n; ++i) {
if (i != 0) {
// 左指针向右移动一格,移除一个字符
occ.erase(s[i - 1]);
}
while (rk + 1 < n && !occ.count(s[rk + 1])) {
// 不断地移动右指针
occ.insert(s[rk + 1]);
++rk;
}
// 第 i 到 rk 个字符是一个极长的无重复字符子串
ans = max(ans, rk - i + 1);
}
return ans;
作者:LeetCode-Solution
链接:https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/solution/wu-zhong-fu-zi-fu-de-zui-chang-zi-chuan-by-leetc-2/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
3.图解
第一步,只有一位
第二步,j右移一位
第三步,j右移一位
第四步,j右移一位
第五步,j右移一位,加入s[4]值为b,遍历前面发现字符串中有b,则i右移一位,发现还有,再右移,直到把s[1]排除在外。
第六步,遍历前面发现字符串中有b,则i右移一位,
第七步,再次遍历前面发现字符串中有b,则i右移一位,
第八步,j右移一位,
第九步,遍历前面发现字符串中有c,则i右移一位,
第十步,j右移一位
第十一步,遍历前面发现字符串中有b,则i右移一位,
第十二步,再次遍历前面发现字符串中有b,则i右移一位,
第十三步,j右移一位
第十四步,遍历前面发现字符串中有b,则i右移一位,
第十五步,再次遍历前面发现字符串中有b,则i右移一位,
第十六步,结束。
三、再优化
上面的图例中有无效操作,比如第五步,得知新加入的s[4]与里面有重复,i一步一步走,我们知道,在i到达重复元素前,这一串字符都是无效的,所以我们有没有办法直接定位到重复字符的位置,从此位置的下一个位置开始遍历,即i等于重复字符的下一位:跳到第七步,从i=2。
1.步骤详解
三个循环:
第一步,首先要定义一个变量 i,从头遍历至尾部,需要一个循环。
第二步,还需要定义一个变量 j,表示字符串的右边界,每次移动一格。
第三步,还需要一个变量 k,从 i 循环到 j-1,观察是否有和 j 相同的字符,k从0开始到 j-1 结束。
2.图解
按照前面流程自行分析。
3.一个细节
每次j移动,都会产生一个len,如果i后面剩余的字符小于len,那就没有再判断的必要了,因为就算后面全部不重复,加起来也不会大于len。因此最终的图解如下:
4.展示你的代码
int i = 0, len = 0, j = 1;
while(s[i]){
int k = 0;
while(s[j]){
int flag = 0;
while((i + k) < j){
if(s[j] == s[i + k]){
flag = 1;
break;
}
k++;
}
if(flag)
break;
j++;
k = 0;
}
if((j - i) > len)
len = j - i;
i = i + k + 1;
if((i + len) > s.size())
break;
j++;
}
return len;
效果:
四、最后
实在没有办法再优化了,有更好的思路的朋友可以留言私聊一起学习。刚刚开始刷算法题,记录一下思考的过程。