无重复最长子串问题

白·洛

已于 2022-02-09 19:05:19 修改

阅读量380

点赞数 2

文章标签：算法 python leetcode

于 2022-02-09 19:04:07 首次发布

本文链接：https://blog.csdn.net/qq_43349533/article/details/122841795

版权

学习笔记：无重复最长子串问题

刷力扣杯的时候遇到一道比较经典的问题，给定一个任意长度的字符串，返回其中无重复子串的最大长度。这种问题比较经典的解法是使用滑动窗口，在数组中不断检索字符并更新最大长度

滑动窗口

滑动窗口的基本思想就是在字符串序列中维护两个指针，Start指针和End指针，End指针不断向后移动，当检索到重复字符之后，将Start指针移动到已检索的字符列表里与当前出现字符出现重复的字符的后一位。举个例子：

图示1

例如当前End指针检索到b的位置，Start指针处于a的位置，此时发现b已经是重复字符了，而当前记录的子串长度为3，那么此时需要将Start指针移动到v字符的位置，如下图所示

Start， End分别表示两个指针，加粗区域表示已检索过的子串
为什么要移动到这个位置呢？

这是因为我们的目的是找到长度最大的子串，现在我们发现了第一个重复的字符，但我们并不确定后面还有没有长度更长的子串，因此我们选择保留后一个字符舍弃前一个字符，保证Start指针和End指针之间没有重复字符，并重新计算。

然后更新记录的子串最大长度，此时最大子串长度应该等于：

CurrentLength = Max(End - Start + 1, CurrentLength)

End - Start是什么意思？

因为在该字符序列中，指针是通过记录下标来找到位置的，因此我们要计算子串的长度可以直接通过后指针的下标减前指针的下标再加1来获得。

hashmap优化

通过双指针检索最长子串的问题已经解决了，现在来谈谈优化的问题。如何更高效的检索到发生重复字符的位置呢？可以通过维护一个简单的hashmap来快速找到重复字符的位置，即使用一个Map或Dictionary 来存储检索过的字符以及位置，可以将key值设置为字符，value值设置为该字符在原序列中的下标的后一个位置。依然是上面那个例子，如下图所示：
Map表示维护的hashmap
为什么要存储每个字符的后一个位置？

这是为了便于更新Start指针位置，更快速的定位新的开始位置。因此，新的Start指针的位置应该为：

Start = Map[String[End]]

当然，直接存储字符的位置也是没问题的，那就在更新Start位置的时候需要进行一个+1的操作

Start = Map[String[End]] + 1

最后，贴上最终代码以供参考

class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        hashdic = {}
        start = 0
        end = 0
        res = 0
        for i in range(len(s)):
            end = i
            if s[end] in hashdic:
                start = max(hashdic[s[end]], start)
            hashdic[s[i]] = end + 1
            res = max(end - start + 1, res)
        return res