leetcode 第三题 无重复字符的最长子串
给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。
输入: s = "abcabcbb"
输出: 3
解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。
输入: s = "bbbbb"
输出: 1
解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。
输入: s = "pwwkew"
输出: 3
解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。
请注意,你的答案必须是 子串 的长度,"pwke" 是一个子序列,不是子串。
输入: s = ""
输出: 0
最简单的暴力的方式,从头遍历所有的数据,将数据的后面部分的数据全部进行检测,检测部分就是逐一遍历看其中的数据是否出现在前面的数列中,算法复杂度是 n2,代码如下
class Solution:
def __init__(self):
self.max_length = 0
def get_str_length(self, str_data):
store_list = []
for data in (str_data):
if data in store_list:
return len(store_list)
else:
store_list.append(data)
return len(store_list)
def lengthOfLongestSubstring(self, s):
str_length = len(s)
for i in range(str_length):
son_length = self.get_str_length(s[i:])
if son_length > self.max_length:
self.max_length = son_length
return self.max_length
if __name__ == '__main__':
aa = Solution()
str_test = "abcabcbb"
print(aa.lengthOfLongestSubstring(str_test))
下面对于程序进行优化,如果我们是人我们如何加速整个寻找的流程呢?
滑动窗口问题可以借助类似于kmp算法的模式思考,因为我们在检测字符串abcdabcdabcd,我们在检测到第二个a的时候终止进行第二次的寻找,但是关键的地方来了,我们要从b开始吗???答案是否定的,因为我们已经检测过了bcd一定是不重复的,这个是先验知识,甚至说bcda也是不重复的,我们利用这个知识进行一次优化。
下面是leetcode的官方代码,使用set替代了重复的空间开销,后面的阶段在set中保留上一次的循环数据,减少了重复循环次数
class Solution:
def lengthOfLongestSubstring(self, s: str) -> int:
# 哈希集合,记录每个字符是否出现过
occ = set()
n = len(s)
# 右指针,初始值为 -1,相当于我们在字符串的左边界的左侧,还没有开始移动
rk, ans = -1, 0
for i in range(n):
if i != 0:
# 左指针向右移动一格,移除一个字符
occ.remove(s[i - 1])
while rk + 1 < n and s[rk + 1] not in occ:
# 不断地移动右指针
occ.add(s[rk + 1])
rk += 1
# 第 i 到 rk 个字符是一个极长的无重复字符子串
ans = max(ans, rk - i + 1)
return ans