题目
标题和出处
标题:两个相同字符之间的最长子字符串
难度
3 级
题目描述
要求
给你一个字符串 s \texttt{s} s,请你返回两个相同字符之间的最长子字符串的长度,计算长度时不含这两个字符。如果不存在这样的子字符串,返回 -1 \texttt{-1} -1。
子字符串是字符串中的一个连续字符序列。
示例
示例 1:
输入:
s
=
"aa"
\texttt{s = "aa"}
s = "aa"
输出:
0
\texttt{0}
0
解释:最优的子字符串是两个
‘a’
\texttt{`a'}
‘a’ 之间的空子字符串。
示例 2:
输入:
s
=
"abca"
\texttt{s = "abca"}
s = "abca"
输出:
2
\texttt{2}
2
解释:最优的子字符串是
"bc"
\texttt{"bc"}
"bc"。
示例 3:
输入:
s
=
"cbzxy"
\texttt{s = "cbzxy"}
s = "cbzxy"
输出:
-1
\texttt{-1}
-1
解释:
s
\texttt{s}
s 中不存在出现出现两次的字符,所以返回
-1
\texttt{-1}
-1。
示例 4:
输入:
s
=
"cabbac"
\texttt{s = "cabbac"}
s = "cabbac"
输出:
4
\texttt{4}
4
解释:最优的子字符串是
"abba"
\texttt{"abba"}
"abba",其他的非最优解包括
"bb"
\texttt{"bb"}
"bb" 和
""
\texttt{""}
""。
数据范围
- 1 ≤ s.length ≤ 300 \texttt{1} \le \texttt{s.length} \le \texttt{300} 1≤s.length≤300
- s \texttt{s} s 只含小写英语字母
解法
思路和算法
对于一个特定字符 ch \textit{ch} ch,只有当 ch \textit{ch} ch 在字符串 s s s 中出现至少两次时,才有两个相同字符 ch \textit{ch} ch 之间的子字符串。为了得到两个相同字符 ch \textit{ch} ch 之间的最长子字符串,需要找到字符 ch \textit{ch} ch 在字符串 s s s 中出现的最小下标和最大下标。对于所有字符得到两个相同字符之间的最长子字符串的长度之后,即可得到字符串 s s s 的两个相同字符之间的最长子字符串的长度。
使用哈希表记录每个字符在字符串 s s s 中出现的最小下标,从左到右遍历字符串 s s s,对于每个字符 ch \textit{ch} ch 进行如下操作:
-
如果哈希表中尚未记录字符 ch \textit{ch} ch 的最小下标,则当前下标是最小下标,将字符 ch \textit{ch} ch 和当前下标加入哈希表;
-
如果哈希表中已经记录字符 ch \textit{ch} ch 的最小下标,则根据当前下标与最小下标计算两个相同字符之间的子字符串的长度,计算方法为两个下标之差减 1 1 1,并更新两个相同字符之间的最长子字符串的长度。
由于遍历过程中一定会遇到每个字符在字符串 s s s 中出现的最大下标,因此对于每个字符 ch \textit{ch} ch 一定可以得到两个相同字符 ch \textit{ch} ch 之间的最长子字符串。遍历结束之后即可得到两个相同字符之间的最长子字符串的长度。
实现方面,由于字符串 s s s 只包含小写英语字母,因此可以使用长度为 26 26 26 的数组代替哈希表记录每个字符在字符串 s s s 出现的最小下标,初始时每个字符的最小下标都是 − 1 -1 −1,表示尚未遇到该字符。
代码
class Solution {
public int maxLengthBetweenEqualCharacters(String s) {
int maxLength = -1;
int[] firstIndices = new int[26];
Arrays.fill(firstIndices, -1);
int length = s.length();
for (int i = 0; i < length; i++) {
char ch = s.charAt(i);
int letterIndex = ch - 'a';
if (firstIndices[letterIndex] < 0) {
firstIndices[letterIndex] = i;
} else {
maxLength = Math.max(maxLength, i - firstIndices[letterIndex] - 1);
}
}
return maxLength;
}
}
复杂度分析
-
时间复杂度: O ( n ) O(n) O(n),其中 n n n 是字符串 s s s 的长度。需要遍历字符串 s s s 一次,记录每个字符在字符串 s s s 中出现的最小下标,并计算两个相同字符之间的最长子字符串的长度。
-
空间复杂度: O ( ∣ Σ ∣ ) O(|\Sigma|) O(∣Σ∣),其中 Σ \Sigma Σ 是字符集,这道题中 Σ \Sigma Σ 是全部小写英语字母, ∣ Σ ∣ = 26 |\Sigma| = 26 ∣Σ∣=26。空间复杂度主要取决于哈希表,需要使用哈希表记录每个字符在字符串 s s s 出现的最小下标。