题目
字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一个字母只会出现在其中的一个片段。返回一个表示每个字符串片段的长度的列表。
示例 1:
输入:S = "ababcbacadefegdehijhklij"
输出:[9,7,8]
解释:
划分结果为 "ababcbaca", "defegde", "hijhklij"。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 的划分是错误的,因为划分的片段数较少。
提示:
S的长度在[1, 500]之间。
S只包含小写字母 'a' 到 'z' 。
解题思路
先做了合并区间后,才做的这道题。求划分字符串片段,实际上可以转换为,求出每个字母出现的index,然后最早的index和最后的index,就是这个字母出现的区间。因为每个字母只能出现在1个片段里,所以其实就是合并这些重叠的区间。
看了一个题解,发现其实还可以另外一种思路,做法很像跳跃游戏
首先保存每个字母出现的最右边的下标,然后从前向后扫描。如果当前位置的字母,在前面字母的最右下标范围内,那么就不断扩展最右下标。如果当前位置字母已经不在最右下标的范围内,说明前面的字母可以分成1段了,此时更新最右下标为当前字母,并且统计前面的长度即可。
注意一点是,当走完全程后,实际上最后一个index对应的区间还没算,所以还需要补充一下最右index对应的区间
代码
class Solution:
def partitionLabels(self, S: str) -> List[int]:
index_dict = {}
for index in range(len(S)):
if S[index] in index_dict:
index_dict[S[index]][1] = index
else:
index_dict[S[index]] = [index, index]
intervals = sorted(index_dict.values())
prev, p = 0, 1
ans = []
while p < len(intervals):
if intervals[p][0] <= intervals[prev][1]:
intervals[prev][1] = max(intervals[p][1], intervals[prev][1])
else:
ans.append(intervals[prev][1] - intervals[prev][0] + 1)
prev = p
p += 1
ans.append(intervals[prev][1] - intervals[prev][0] + 1)
return ans
另外的思路:
class Solution:
def partitionLabels(self, S: str) -> List[int]:
right_most_index = {ch: index for index, ch in enumerate(S)}
ans = []
prev_index = 0
right_most = 0
for index, ch in enumerate(S):
if index > right_most:
ans.append(index - prev_index)
prev_index = index
right_most = max(right_most, right_most_index[ch])
return ans + [index - prev_index + 1]