面试题:最长不含重复字符的子字符串
题目:
请从字符串中找出一个最长的不包含重复字符的子字符串,计算该最长子字符串的长度
假设字符串中只包含'a'~'z'的字符
例如,在字符串“arabcacfr”中,最长的不含重复字符的子字符串是“acfr”,长度为4
思路:
最开始的思路是,计算【以每个字符为开始】的最长字符串的长度,需要使用两层循环,外层为每个字符为开始,内层循环为从该字符的下一个字符开始,直到寻找到一个字符串中的重复字符——有很多重复操作,如在对arabcacfr的第2个字符进行查找时,会对rabc的abc都查找一次,但在以a开头进行查找时,又会对bc再查找一次
后面使用的是记录【以每个字符为结尾】的最长字符串的长度
方法:
假设对于第i个位置的字符,已经知道以i为结尾的最长字符串长度为x
此时i+1有两种情况
1)i+1在之前未出现过:则第i+1为结尾的最长字符串长度直接为x+1
2)i+1在之前出现过,也存在两种情况:
i+1在之前出现的位置,在以i为结尾的最长字符串之中:则第i+1个字符不能直接接在该最长字符串之后,此时的最长字符串只能是——从上个该字符出现的位置的后一位,到当前位置的字符串(如在arabcacfr中,a【rabc】acfr以c结尾的最长字符串长度为4,此时c之后的a,上次出现位置在c的最长字符串之中,所以以a为结尾的最长字符串只能为ara【bca】cfr)
i+1在之前出现的位置,不在以i为结尾的最长字符串之中:则第i+1个字符可直接接在该最长字符串之后,则第i+1为结尾的最长字符串长度直接为x+1(如在arabcacfr中,arabc【acf】r以f为结尾的最长字符串长度为3,此时f之后的r,上次出现位置为acf之前,所以之前出现的r不影响后面的r直接与前面的最长字符串连接)
代码:
具体实现细节见代码注释
public class Q48 {
public static void main(String[] args) {
String s = "arabcacfr";
System.out.println(longestSubstr(s));
}
public static String longestSubstr(String s) {
// max用于保存位置和长度
int maxloc = 0;
int maxlength = 1;
// len用于保存此字符之前字符的最长字符串长度
int len = maxlength;
// 用长度为26的数组来保存字符上次出现的位置
int[] lastC = new int[26];
// 循环
// 计算以每一个位置为结尾的最长字符串长度
for(int i=1;i<s.length();i++) {
// 之前没出现过
// 不能直接用 lastC[s.charAt(i)]==0 因为最开始都是0
if(s.charAt(lastC[s.charAt(i)-'a'])!= s.charAt(i)) {
len = len +1;
}
// 之前出现过 则计算距离
// 在上一次的最长字符串长度之外,则不影响此次的添加字符,len直接加一
// 在上一次的最长字符串长度之内,则以此字符串结尾的最长字符只能从上一次的出现之后开始计算,即distance
if(s.charAt(lastC[s.charAt(i)-'a'])== s.charAt(i)) {
int dis = i - lastC[s.charAt(i)-'a'];
if(dis>len) {
len = len +1;
}else {
len = dis;
}
}
// 更新此字符串的出现位置
lastC[s.charAt(i)-'a'] = i;
if(maxlength<len) {
maxloc = i;
maxlength = len;
}
}
return s.substring(maxloc-maxlength+1,maxloc+1);
}
}