划分字母区间
题目描述:
字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。返回一个表示每个字符串片段的长度的列表。
输入输出样例
输入:S = "ababcbacadefegdehijhklij"
输出:[9,7,8]
解释:
划分结果为 "ababcbaca", "defegde", "hijhklij"。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 的划分是错误的,因为划分的片段数较少。
题解:
本题在采用贪心算法的基础上,采用了预处理降低了题目难度。由于同一个字母只能出现在同一个片段,显然同一个字母的第一次出现的下标位置和最后一次出现的下标位置必须出现在同一个片段。因此需要遍历字符串,得到每个字母最后一次出现的下标位置。然后我们就可以使用贪心算法将字符串划分成为尽可能多的片段;
只需要从左到右遍历字符串,对于每个访问到的字母 x,得到当前字母的最后一次出现的下标位置 endx,则当前片段的结束下标一定不会小于 endx,因此令 end=max(end,endx);访问到end时,获取该段字符串长度,然后进行新的判断即可;
具体代码
class L736 {
public:
vector<int> partitionLabels(string S) {
int lastPos[26];//记录各个字母最后出现位置的数组
int length = S.size();
for (int i = 0; i < length; i++) {
lastPos[S[i] - 'a'] = i;
//利用阿斯科码值
}
vector<int> partition;
int start = 0, end = 0;
for (int i = 0; i < length; i++) {
end = max(end, lastPos[S[i] - 'a']);
if (i == end) {
partition.push_back(end - start + 1);
start = end + 1;
}
}
return partition;
}
};