题目描述
字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一个字母只会出现在其中的一个片段。返回一个表示每个字符串片段的长度的列表。
示例 1:
输入:S = “ababcbacadefegdehijhklij”
输出:[9,7,8]
解释:
划分结果为 “ababcbaca”, “defegde”, “hijhklij”。
每个字母最多出现在一个片段中。
像 “ababcbacadefegde”, “hijhklij” 的划分是错误的,因为划分的片段数较少。
提示:
S的长度在[1, 500]之间。
S只包含小写字母 'a' 到 'z' 。
来源:力扣
题解
解题思路
题目比较绕,不太容易理解。
要求把相同字母放在同一个片段内,以a为例,第一个a在字符串第一个位置,最后一个a在字符串第九个位置,那么1到9一定要为一个片段,否则a会分布在多个片段内,违背题意。
1到9组成的片段内又有其他字母(b和c),那么又要考虑最后一个b和最后一个c的位置。由题目中的示例,可以看出来,最后一个b和最后一个c都在字符串1~9内,因此1到9是一个包含相同字母的最短字符串(每个字符串越短,那么能够分出来的字符串就越多)。
加入字符串为ababcbacabefegdehijhklij,那么在对字符b做讨论的时候,最后一个b出现的位置是10,则需将第10个字符加入进去,接着再去讨论c的情况。
基于这个思路,可以用map来记录每个字母的最后出现位置,用start和end记录字符串片段的起始位置只讨论a的时候start和end分别为0和9,随着其他字符的加入,end应该随之改变,这里用end和新字符串的最大值来对end进行更新(如果新字符的最后出现位置大于end,那么end=新位置;否则,end不变)。
什么时候可以确定一个分段呢?当我们用来遍历的指针指向end的时候,说明所有出现的字符都被包含进去了,后面剩下的分段不再有已经出现的这些字符了(a b c),那么可以说我们找到了当前最短的一个片段,接着对剩下的片段进行讨论(start指向剩下片段的起点)。
代码
class Solution {
public:
vector<int> partitionLabels(string S) {
vector<int> res; //保存结果
unordered_map<char,int> map; //创建map,用来保存每个字符的最后出现位置
int start = 0;int end = 0; //起始和结束指针
for(int i=0;i<S.size();i++){ //先遍历一遍,记录每个字符的最后出现位置
map[S[i]] = i;
}
for(int i=0;i<S.size();i++){ // 将end与map[S[i]]比较,如果map比较大,也
end = max(end,map[S[i]]); // 就是说新字符的最后出现位置没在当前片段内,
if(i == end ){ // 那么增大当前片段
res.push_back(end-start+1); // i等于end的时候,一个片段被确定了,将长度保存
start = i+1;
}
}
return res;
}
};