问题描述
给定一个字符串,找出其中不含有重复字符的最长子串的长度。例如,给定字符串"abcabcbb",最长不重复子串是"abc",长度为3;给定字符串"bbbbb",最长不重复子串是"b",长度为1。
解决方案
这个问题可以用滑动窗口的方法来解决。滑动窗口是一种常用的技巧,它可以用两个变量来表示数组或字符串中的一个连续的区间,然后根据一定的条件移动这两个变量,从而达到一定的目的。我们可以用两个指针分别指向字符串的开头和结尾,表示当前的窗口,然后用一个哈希表来记录窗口中的字符及其出现的次数。然后,我们不断扩展窗口的右边界,每次加入一个新的字符,同时更新哈希表,如果发现新的字符已经在哈希表中存在,说明出现了重复,那么就需要缩小窗口的左边界,直到没有重复为止。在这个过程中,我们记录下每次窗口的大小,取最大值作为最终的答案。这个算法的时间复杂度是O(n),空间复杂度是O(m),其中n是字符串的长度,m是字符集的大小。
代码
以下是用C语言实现的代码,假设字符串的长度不超过100,字符集为ASCII码。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
// 定义一个哈希表的大小,可以根据需要调整
#define HASH_SIZE 128
// 定义一个函数,找出一个字符串中不含有重复字符的最长子串的长度,返回一个整数
int length_of_longest_substring(char *str) {
// 获取字符串的长度
int len = strlen(str);
// 如果字符串为空或只有一个字符,直接返回长度
if (len <= 1) {
return len;
}
// 创建一个哈希表,用来存储窗口中的字符及其出现的次数
int hash[HASH_SIZE];
// 初始化哈希表为0
for (int i = 0; i < HASH_SIZE; i++) {
hash[i] = 0;
}
// 定义两个指针,分别指向窗口的左右边界,初始都为0
int left = 0;
int right = 0;
// 定义一个变量,用来记录最长子串的长度,初始为0
int max_len = 0;
// 循环,直到右指针到达字符串的末尾
while (right < len) {
// 获取右指针指向的字符的ASCII码
int index = (int)str[right];
// 在哈希表中增加该字符的出现次数
hash[index]++;
// 如果该字符的出现次数大于1,说明出现了重复
while (hash[index] > 1) {
// 获取左指针指向的字符的ASCII码
int left_index = (int)str[left];
// 在哈希表中减少该字符的出现次数
hash[left_index]--;
// 移动左指针,缩小窗口
left++;
}
// 计算当前窗口的大小,即不重复子串的长度
int curr_len = right - left + 1;
// 如果当前长度大于最大长度,更新最大长度
if (curr_len > max_len) {
max_len = curr_len;
}
// 移动右指针,扩大窗口
right++;
}
// 返回最大长度
return max_len;
}
// 定义一个主函数,测试上述函数
int main() {
// 定义一个测试用的字符串
char str[] = "abcdefabb";
// 调用函数,得到结果
int result = length_of_longest_substring(str);
// 打印结果
printf("字符串:%s\n", str);
printf("结果:%d\n", result);
// 返回0,表示程序正常结束
return 0;
}
运行结果:
我的总结
这个问题的核心是如何在不知道字符串的内容的情况下,找出不含有重复字符的最长子串的长度。如果用暴力的方法,就需要枚举所有的子串,然后判断每个子串是否有重复,时间复杂度是O(n^3),效率很低。如果用滑动窗口的方法,就可以在O(n)的时间复杂度下,完成这个任务。滑动窗口的原理是,维护一个不重复的区间,然后不断扩展和缩小这个区间,同时记录下最大的区间长度。滑动窗口是一种非常实用的技巧,可以解决很多字符串相关的问题,值得学习和掌握。