题目链接
https://leetcode.com/problems/partition-labels/
题目描述
给定由小写字母组成的字符串S,将字符串划分为尽可能多的片段,使同一字母最多出现在一个片段中。返回一个表示每个字符串长度的列表。
示例
输入:S=“ababcbacadefegdehijhklij”
输出:[9,7,8]
划分结果为"ababcbaca","defegde","hijhklij" 。每个字母最多出现在一个片段中。
如果划分为"ababcbacadefegde",“hijhklij”是错误的,因为片段还可以继续划分。
解题思路
题目要求划分为尽可能多的片段,我们可以将问题转换为“划分出的每个片段都是符合要求的最短片段“。由于同一个字母只能出现在同一个片段中,因此同一个字母第一次出现的下标位置和最后一次出现的下标位置必须出现在同一个片段。我们可以记录每个字母最后一次出现的下标位置,然后利用贪心策略寻找每个片段的最小结束下标,由此保证每个片段的长度一定是符合要求的最短长度。如果取更小的片段,就一定会有同一个字母出现在多个片段中的情况。
贪心策略的执行步骤为:
维护result列表存储各个片段的长度。
(1)从左到右遍历字符串,维护当前片段的start和end索引,两个索引初始化为0。
(2)对于每个访问到的字母c,得到该字母最后一次出现的下标end_c,那么当前片段的结束下标一定不会小于end_c,因此有end = max(end,end_C)
(3)访问到下标end时,标志着当前片段就访问结束,当前片段的长度为end-start+1,将长度添加到result列表,然后令start = end + 1,继续找下一个片段的最小结束下标。
重复步骤(1)、(2)、(3),直到字符串被遍历完。
这样处理,当前片段中的每个字母都一定只存在于当前片段里,不会出现在其他片段。并且每次取片段都是符合要求的最短片段,因此能够得到最多的片段数。
Python实现
ord()为Python中的内置函数,以一个字符作为参数,返回对应的ASCII数值或Unicode值的十进制整数。
class Solution:
def partitionLabels(self, S: str) -> List[int]:
#开一个list存储每个字母最后一次出现的下标位置
last = [0 for _ in range(26)] #共26个字母,因此开数组大小为26
for i in range(len(S)):
last[ord(S[i])-ord('a')] = i
result = [] #存储各个片段长度的列表
start,end = 0,0 #标识当前片段的开始和结束索引
for i in range(len(S)):
end = max(end,last[ord(S[i])-ord('a')]) #更新片段的最小结束下标
if i == end: #如果到达当前片段终点,将片段加入result,继续寻找下一个片段
result.append(end-start+1)
start = end + 1
return result
时间复杂度与空间复杂度
时间复杂度为O(N),空间复杂度为O(),其中
为字符串中的字符集,由于此题中字符串只包含小写字母,因此
等于26。
参考
https://leetcode-cn.com/problems/partition-labels/solution/hua-fen-zi-mu-qu-jian-by-leetcode-solution/