代码随想录阅读笔记-贪心算法【划分字母区间】

DevilHeart灬

于 2024-05-08 10:33:57 发布

阅读量253

点赞数 5

文章标签：笔记贪心算法算法

本文链接：https://blog.csdn.net/weixin_46184703/article/details/138559537

版权

题目

字符串 S 由小写字母组成。我们要把这个字符串划分为尽可能多的片段，同一字母最多出现在一个片段中。返回一个表示每个字符串片段的长度的列表。

示例：

输入：S = "ababcbacadefegdehijhklij"
输出：[9,7,8] 解释：划分结果为 "ababcbaca", "defegde", "hijhklij"。每个字母最多出现在一个片段中。像 "ababcbacadefegde", "hijhklij" 的划分是错误的，因为划分的片段数较少。

提示：

S的长度在[1, 500]之间。
S只包含小写字母 'a' 到 'z' 。

思路

一想到分割字符串就想到了回溯，但本题其实不用回溯去暴力搜索。

题目要求同一字母最多出现在一个片段中，那么如何把同一个字母的都圈在同一个区间里呢？

如果没有接触过这种题目的话，还挺有难度的。

在遍历的过程中相当于是要找每一个字母的边界，如果找到之前遍历过的所有字母的最远边界，说明这个边界就是分割点了。此时前面出现过所有字母，最远也就到这个边界了。

可以分为如下两步：

统计每一个字符最后出现的位置
从头遍历字符，并更新字符的最远出现下标，如果找到字符最远出现位置下标和当前下标相等了，则找到了分割点

如图：

763.划分字母区间

明白原理之后，代码并不复杂，如下：

class Solution {
public:
    vector<int> partitionLabels(string S) {
        int hash[27] = {0}; // i为字符，hash[i]为字符出现的最后位置
        for (int i = 0; i < S.size(); i++) { // 统计每一个字符最后出现的位置
            hash[S[i] - 'a'] = i;
        }
        vector<int> result;
        int left = 0;
        int right = 0;
        for (int i = 0; i < S.size(); i++) {
            right = max(right, hash[S[i] - 'a']); // 找到字符出现的最远边界
            if (i == right) {//寻找这个判断条件是关键
                result.push_back(right - left + 1);
                left = i + 1;
            }
        }
        return result;
    }
};

时间复杂度：O(n)
空间复杂度：O(1)，使用的hash数组是固定大小

补充

这里提供一种与前两道题相同的思路。

统计字符串中所有字符的起始和结束位置，记录这些区间(实际上也就是无重叠区间题目里的输入)，将区间按左边界从小到大排序，找到边界将区间划分成组，互不重叠。找到的边界就是答案。

class Solution {
public:
    static bool cmp(vector<int> &a, vector<int> &b) {
        return a[0] < b[0];
    }
    // 记录每个字母出现的区间
    vector<vector<int>> countLabels(string s) {
        vector<vector<int>> hash(26, vector<int>(2, INT_MIN));
        vector<vector<int>> hash_filter;
        for (int i = 0; i < s.size(); ++i) {
            if (hash[s[i] - 'a'][0] == INT_MIN) {
                hash[s[i] - 'a'][0] = i;
            }
            hash[s[i] - 'a'][1] = i;
        }
        // 去除字符串中未出现的字母所占用区间
        for (int i = 0; i < hash.size(); ++i) {
            if (hash[i][0] != INT_MIN) {
                hash_filter.push_back(hash[i]);
            }
        }
        return hash_filter;
    }
    vector<int> partitionLabels(string s) {
        vector<int> res;
        // 这一步得到的 hash 即为无重叠区间题意中的输入样例格式：区间列表
        // 只不过现在我们要求的是区间分割点
        vector<vector<int>> hash = countLabels(s);
        // 按照左边界从小到大排序
        sort(hash.begin(), hash.end(), cmp);
        // 记录最大右边界
        int rightBoard = hash[0][1];
        int leftBoard = 0;
        for (int i = 1; i < hash.size(); ++i) {
            // 由于字符串一定能分割，因此,
            // 一旦下一区间左边界大于当前右边界，即可认为出现分割点
            if (hash[i][0] > rightBoard) {
                res.push_back(rightBoard - leftBoard + 1);
                leftBoard = hash[i][0];
            }
            rightBoard = max(rightBoard, hash[i][1]);
        }
        // 最右端
        res.push_back(rightBoard - leftBoard + 1);
        return res;
    }
};

下面将笔者的代码列举如下，思路与上述相同，只不过实现上有所差异（因为用到了很多遍历，所以用时上比较耗时（n平方的复杂度））

class Solution {
public:
    vector<int> partitionLabels(string s) {
        vector<int> result;
        if(s.size() == 1)
        {
            result.push_back(1);
            return result;
        }
        int length = 0;//记录每段的长度
        int end = 0;//记录最大边界
        for(int i = 0 ; i < s.size() ; i++)
        {
            length ++;//每次动态增长length
            for(int j = s.size()-1 ; j > end ; j--)//从后向前更新最大边界
            {
                if(s[j] == s[i])
                {
                    end = j;
                    break;
                }
            }
            if(i == end)//如果当前遍历位置与边界重合，证明当前这一段符合要求，可以pushback并清零length
            {
                result.push_back(length);
                length = 0;
            }
        }
        if(result.empty())//不能分割的情况
        {
            result.push_back(s.size());
        }
        return result;
    }
};

DevilHeart灬

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
代码随想录阅读笔记-贪心算法【划分字母区间】

我们要把这个字符串划分为尽可能多的片段，同一字母最多出现在一个片段中。返回一个表示每个字符串片段的长度的列表。下面将笔者的代码列举如下，思路与上述相同，只不过实现上有所差异（因为用到了很多遍历，所以用时上比较耗时（n平方的复杂度））统计字符串中所有字符的起始和结束位置，记录这些区间(实际上也就是无重叠区间题目里的输入)，题目要求同一字母最多出现在一个片段中，那么如何把同一个字母的都圈在同一个区间里呢？一想到分割字符串就想到了回溯，但本题其实不用回溯去暴力搜索。在遍历的过程中相当于是要找每一个字母的边界，
复制链接

扫一扫