#include<iostream>
#include<string>
#include<math.h>
#include<unordered_set>
using namespace std;
方法一:暴力法
思路
逐个检查所有的子字符串,看它是否不含有重复的字符。
算法
假设我们有一个函数 boolean allUnique(String substring)
,如果子字符串中的字符都是唯一的,它会返回true,否则会返回false。 我们可以遍历给定字符串 s
的所有可能的子字符串并调用函数 allUnique
。 如果事实证明返回值为true,那么我们将会更新无重复字符子串的最大长度的答案。
现在让我们填补缺少的部分:
-
为了枚举给定字符串的所有子字符串,我们需要枚举它们开始和结束的索引。假设开始和结束的索引分别为 ii 和 jj。那么我们有 0 \leq i \lt j \leq n0≤i<j≤n (这里的结束索引 jj 是按惯例排除的)。因此,使用 ii 从0到 n - 1n−1 以及 jj 从 i+1i+1 到 nn 这两个嵌套的循环,我们可以枚举出
s
的所有子字符串。 - 要检查一个字符串是否有重复字符,我们可以使用集合。我们遍历字符串中的所有字符,并将它们逐个放入
set
中。在放置一个字符之前,我们检查该集合是否已经包含它。如果包含,我们会返回false
。循环结束后,我们返回true
。
//左闭右开区间
bool allUnique(string s, int start, int end)
{
unordered_set<char> set;
for (int i = start; i < end; i++)
{
char ch = s.at(i);
if (set.find(ch) != set.end())
{
return false;
}
else
{
set.insert(ch);
}
}
return true;
}
int lengthOfLongestSubstring(string s) {
int length = s.length();
int max_length = 0;
for (int i = 0;i < length;i++)
{
for (int j = i + 1;j <=length;j++)
{
if (allUnique(s,i,j))
{
//迭代更新最大长度子串
max_length = max_length > j - i ? max_length : j - i;
}
}
}
return max_length;
}
方法二:
算法
暴力法非常简单。但它太慢了。那么我们该如何优化它呢?
在暴力法中,我们会反复检查一个子字符串是否含有有重复的字符,但这是没有必要的。如果从索引 ii 到 j - 1j−1之间的子字符串 s_{ij}sij 已经被检查为没有重复字符。我们只需要检查 s[j]s[j] 对应的字符是否已经存在于子字符串 s_{ij}sij中。
要检查一个字符是否已经在子字符串中,我们可以检查整个子字符串,这将产生一个复杂度为 O(n^2)O(n2) 的算法,但我们可以做得更好。
通过使用 HashSet 作为滑动窗口,我们可以用 O(1)O(1) 的时间来完成对字符是否在当前的子字符串中的检查。
滑动窗口是数组/字符串问题中常用的抽象概念。 窗口通常是在数组/字符串中由开始和结束索引定义的一系列元素的集合,即 [i, j)[i,j)(左闭,右开)。而滑动窗口是可以将两个边界向某一方向“滑动”的窗口。例如,我们将 [i, j)[i,j)向右滑动 11 个元素,则它将变为 [i+1, j+1)[i+1,j+1)(左闭,右开)。
回到我们的问题,我们使用 HashSet 将字符存储在当前窗口 [i, j)[i,j)(最初 j = ij=i)中。 然后我们向右侧滑动索引 jj,如果它不在 HashSet 中,我们会继续滑动 jj。直到 s[j] 已经存在于 HashSet 中。此时,我们找到的没有重复字符的最长子字符串将会以索引 ii 开头。如果我们对所有的 ii 这样做,就可以得到答案。
int lengthOfLongestSubstring(string s)
{
int len = s.length();
int max_len = 0;
unordered_set<char> set;
//左闭有开区间
for (int i = 0,j = 0;i < len&&j<len;)
{
if (set.find(s.at(j)) == set.end())
{
//向set里面插入
set.insert(s.at(j++));
max_len = max_len > j - i ? max_len : j - i;
}
else
{
//i逐步向后移,set逐步移除前面的元素,直到将重复的s.at(j)的值从set里移除后,上面的j才能继续往后走
set.erase(s.at(i++));
}
}
return max_len;
}
主函数调用:
int main()
{
string s = "abcdegfghijk";
int length = lengthOfLongestSubstring(s);
cout <<length<< endl;
return 0;
}