无重复最长子串问题

学习笔记:无重复最长子串问题

刷力扣杯的时候遇到一道比较经典的问题,给定一个任意长度的字符串,返回其中无重复子串的最大长度。这种问题比较经典的解法是使用滑动窗口,在数组中不断检索字符并更新最大长度

滑动窗口

滑动窗口的基本思想就是在字符串序列中维护两个指针,Start指针和End指针,End指针不断向后移动,当检索到重复字符之后,将Start指针移动到已检索的字符列表里与当前出现字符出现重复的字符的后一位。举个例子:

图示1

例如当前End指针检索到b的位置,Start指针处于a的位置,此时发现b已经是重复字符了,而当前记录的子串长度为3,那么此时需要将Start指针移动到v字符的位置,如下图所示

Start, End分别表示两个指针,加粗区域表示已检索过的子串
为什么要移动到这个位置呢?

这是因为我们的目的是找到长度最大的子串,现在我们发现了第一个重复的字符,但我们并不确定后面还有没有长度更长的子串,因此我们选择保留后一个字符舍弃前一个字符,保证Start指针和End指针之间没有重复字符,并重新计算。

然后更新记录的子串最大长度,此时最大子串长度应该等于:

CurrentLength = Max(End - Start + 1, CurrentLength)

End - Start是什么意思?

因为在该字符序列中,指针是通过记录下标来找到位置的,因此我们要计算子串的长度可以直接通过后指针的下标减前指针的下标再加1来获得。

hashmap优化

通过双指针检索最长子串的问题已经解决了,现在来谈谈优化的问题。如何更高效的检索到发生重复字符的位置呢?可以通过维护一个简单的hashmap来快速找到重复字符的位置,即使用一个Map或Dictionary 来存储检索过的字符以及位置,可以将key值设置为字符,value值设置为该字符在原序列中的下标的后一个位置。依然是上面那个例子,如下图所示:
Map表示维护的hashmap
为什么要存储每个字符的后一个位置?

这是为了便于更新Start指针位置,更快速的定位新的开始位置。因此,新的Start指针的位置应该为:

Start = Map[String[End]]

当然,直接存储字符的位置也是没问题的,那就在更新Start位置的时候需要进行一个+1的操作

Start = Map[String[End]] + 1

最后,贴上最终代码以供参考

class Solution:
    def lengthOfLongestSubstring(self, s: str) -> int:
        hashdic = {}
        start = 0
        end = 0
        res = 0
        for i in range(len(s)):
            end = i
            if s[end] in hashdic:
                start = max(hashdic[s[end]], start)
            hashdic[s[i]] = end + 1
            res = max(end - start + 1, res)
        return res

需要注意的是,这里在更新Start指针位置的时候使用了max函数,这么做的原因是为了防止Start指针向左侧移动,举个例子

在这里插入图片描述
如图所示,在这种情况下当End指针检索到a字符是仍然可以在hashmap中找到该key,但此时先前的a字符已经被排除出当前检索的子串中了,因此需要通过:

Start = Max(Map[String[End]], Start)

来防止Start指针左移

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值