代码随想录算法训练营第三十六天| 435. 无重叠区间、763.划分字母区间、56. 合并区间

小刘很ok

已于 2022-12-02 17:04:10 修改

阅读量233

点赞数

分类专栏： leetcode刷题打卡文章标签：算法数据结构

于 2022-12-02 17:03:17 首次发布

本文链接：https://blog.csdn.net/weixin_44047621/article/details/128150566

版权

leetcode刷题打卡专栏收录该内容

52 篇文章 3 订阅

订阅专栏

435. 无重叠区间

由于是统计重叠区间的数目，所以并不需要真正的删除重叠的区间

可以先统计非重叠区间，最后再用区间总数减去非重叠区间的数目，就是需要移除的重叠区间的数目

做类似的区间题目，肯定涉及到排序，那么就需要考虑是按照左边界排序还是右边界排序，这里采用按照右边界排序，然后从左向右遍历的方法。

在这里插入图片描述
上图是按照右边界排序好的数组，局部最优：优先选择右边界小的区间，留给下一个不重叠区间的空间就大一些，从而尽量避免交叉；全局最优：选取最多的非交叉区间，需要移除的重叠区间数就小。

按照上图，区间，1，2，3，4，5，6都按照右边界排好序。

每次取非交叉区间的时候，都是可右边界最小的来做分割点（这样留给下一个区间的空间就越大），所以第一条分割线就是区间1结束的位置。

接下来就是找大于区间1结束位置的区间，是从区间4开始。

区间4结束之后，在找到区间6，所以一共记录非交叉区间的个数是三个。

总共区间个数为6，减去非交叉区间的个数3。移除区间的最小数量就是3。

class Solution {
public:
    // 按照区间右边界排序
    static bool cmp (const vector<int>& a, const vector<int>& b) {
        return a[1] < b[1];
    }
    int eraseOverlapIntervals(vector<vector<int>>& intervals) {
        if (intervals.size() == 0) return 0;
        sort(intervals.begin(), intervals.end(), cmp);
        int count = 1; // 记录非交叉区间的个数
        int end = intervals[0][1]; // 记录区间分割点
        for (int i = 1; i < intervals.size(); i++) {
            if (end <= intervals[i][0]) {
                end = intervals[i][1];
                count++;
            }
        }
        return intervals.size() - count;
    }
};

763.划分字母区间

此题的思路非常巧妙，分为如下两步：

统计每一个字符最后出现的位置
从头遍历字符，并更新字符的最远出现下标，如果找到字符最远出现位置下标和当前下标相等了，则找到了分割点
采用一个数组记录每个字母出现的最后位置，然后遍历数组，用一个right维护right前面字母所能达到的最远位置，当下标指到right时，证明前面出现的所有字母，在后面都不会出现了，right就是此分组的最后位置。

class Solution {
public:
    vector<int> partitionLabels(string S) {
        int hash[26] = {0}; // i为字符，hash[i]为字符出现的最后位置
        for (int i = 0; i < S.size(); i++) { // 统计每一个字符最后出现的位置
            hash[S[i] - 'a'] = i;
        }
        vector<int> result;
        int left = 0;
        int right = 0;
        for (int i = 0; i < S.size(); i++) {
            right = max(right, hash[S[i] - 'a']); // 找到字符出现的最远边界
            if (i == right) {
                result.push_back(right - left + 1);
                left = i + 1;
            }
        }
        return result;
    }
};

用字母减去‘a’，得到的数作为字母在数组中的索引，经常在字母的题目中遇到，用数组维护字符串比用容器维护更方便而且更节省时间和空间。

56. 合并区间

此题思路与435.无重叠区间类似，此题我的思路是首先按照右边界排序，用start不断维护重叠区间的最左边边界，end维护最右边界，当前一个区间的右边界小于后边区间的左边界，则证明到了重叠区间的最大宽度。

class Solution {
public:
    static bool cmp (const vector<int>& a, const vector<int>& b) {
        return a[1] < b[1];
    }
    vector<vector<int>> merge(vector<vector<int>>& intervals) {
        sort(intervals.begin(), intervals.end(), cmp);
        vector<vector<int>> result;
        int start = intervals[intervals.size() - 1][0];
        int end = intervals[intervals.size() - 1][1];
        for (int i = intervals.size() - 2; i >= 0; i--) {
            start = min(start, intervals[i + 1][0]); //start维护重叠区间的最小值
            if (intervals[i][1] < start) {
                result.push_back({start, end});
                end = intervals[i][1];
            }
        }
        start = min(start, intervals[0][0]); //遍历完成后需要将最左边的区间也加入进去
        result.push_back({start, end});
        return result;
    }
};

下面是卡哥的题解，他是按照左边界排序的：

那么我按照左边界排序，排序之后局部最优：每次合并都取最大的右边界，这样就可以合并更多的区间了，整体最优：合并所有重叠的区间。

局部最优可以推出全局最优，找不出反例，试试贪心。

按照左边界从小到大排序之后，如果 intervals[i][0] < intervals[i - 1][1] 即intervals[i]左边界 < intervals[i - 1]右边界，则一定有重复，因为intervals[i]的左边界一定是大于等于intervals[i - 1]的左边界。

即：intervals[i]的左边界在intervals[i - 1]左边界和右边界的范围内，那么一定有重复！

class Solution {
public:
    // 按照区间左边界从小到大排序
    static bool cmp (const vector<int>& a, const vector<int>& b) {
        return a[0] < b[0];
    }
    vector<vector<int>> merge(vector<vector<int>>& intervals) {
        vector<vector<int>> result;
        if (intervals.size() == 0) return result;
        sort(intervals.begin(), intervals.end(), cmp);
        bool flag = false; // 标记最后一个区间有没有合并
        int length = intervals.size();

        for (int i = 1; i < length; i++) {
            int start = intervals[i - 1][0];    // 初始为i-1区间的左边界
            int end = intervals[i - 1][1];      // 初始i-1区间的右边界
            while (i < length && intervals[i][0] <= end) { // 合并区间
                end = max(end, intervals[i][1]);    // 不断更新右区间
                if (i == length - 1) flag = true;   // 最后一个区间也合并了
                i++;                                // 继续合并下一个区间
            }
            // start和end是表示intervals[i - 1]的左边界右边界，所以最优intervals[i]区间是否合并了要标记一下
            result.push_back({start, end});
        }
        // 如果最后一个区间没有合并，将其加入result
        if (flag == false) {
            result.push_back({intervals[length - 1][0], intervals[length - 1][1]});
        }
        return result;
    }
};