435. 无重叠区间
由于是统计重叠区间的数目,所以并不需要真正的删除重叠的区间
可以先统计非重叠区间,最后再用区间总数减去非重叠区间的数目,就是需要移除的重叠区间的数目
做类似的区间题目,肯定涉及到排序,那么就需要考虑是按照左边界排序还是右边界排序,这里采用按照右边界排序,然后从左向右遍历的方法。
上图是按照右边界排序好的数组,局部最优:优先选择右边界小的区间,留给下一个不重叠区间的空间就大一些,从而尽量避免交叉;全局最优:选取最多的非交叉区间,需要移除的重叠区间数就小。
按照上图,区间,1,2,3,4,5,6都按照右边界排好序。
每次取非交叉区间的时候,都是可右边界最小的来做分割点(这样留给下一个区间的空间就越大),所以第一条分割线就是区间1结束的位置。
接下来就是找大于区间1结束位置的区间,是从区间4开始。
区间4结束之后,在找到区间6,所以一共记录非交叉区间的个数是三个。
总共区间个数为6,减去非交叉区间的个数3。移除区间的最小数量就是3。
class Solution {
public:
// 按照区间右边界排序
static bool cmp (const vector<int>& a, const vector<int>& b) {
return a[1] < b[1];
}
int eraseOverlapIntervals(vector<vector<int>>& intervals) {
if (intervals.size() == 0) return 0;
sort(intervals.begin(), intervals.end(), cmp);
int count = 1; // 记录非交叉区间的个数
int end = intervals[0][1]; // 记录区间分割点
for (int i = 1; i < intervals.size(); i++) {
if (end <= intervals[i][0]) {
end = intervals[i][1];
count++;
}
}
return intervals.size() - count;
}
};
763.划分字母区间
此题的思路非常巧妙,分为如下两步:
- 统计每一个字符最后出现的位置
- 从头遍历字符,并更新字符的最远出现下标,如果找到字符最远出现位置下标和当前下标相等了,则找到了分割点
采用一个数组记录每个字母出现的最后位置,然后遍历数组,用一个right维护right前面字母所能达到的最远位置,当下标指到right时,证明前面出现的所有字母,在后面都不会出现了,right就是此分组的最后位置。
class Solution {
public:
vector<int> partitionLabels(string S) {
int hash[26] = {0}; // i为字符,hash[i]为字符出现的最后位置
for (int i = 0; i < S.size(); i++) { // 统计每一个字符最后出现的位置
hash[S[i] - 'a'] = i;
}
vector<int> result;
int left = 0;
int right = 0;
for (int i = 0; i < S.size(); i++) {
right = max(right, hash[S[i] - 'a']); // 找到字符出现的最远边界
if (i == right) {
result.push_back(right - left + 1);
left = i + 1;
}
}
return result;
}
};
用字母减去‘a’,得到的数作为字母在数组中的索引,经常在字母的题目中遇到,用数组维护字符串比用容器维护更方便而且更节省时间和空间。
56. 合并区间
此题思路与435.无重叠区间类似,此题我的思路是首先按照右边界排序,用start不断维护重叠区间的最左边边界,end维护最右边界,当前一个区间的右边界小于后边区间的左边界,则证明到了重叠区间的最大宽度。
class Solution {
public:
static bool cmp (const vector<int>& a, const vector<int>& b) {
return a[1] < b[1];
}
vector<vector<int>> merge(vector<vector<int>>& intervals) {
sort(intervals.begin(), intervals.end(), cmp);
vector<vector<int>> result;
int start = intervals[intervals.size() - 1][0];
int end = intervals[intervals.size() - 1][1];
for (int i = intervals.size() - 2; i >= 0; i--) {
start = min(start, intervals[i + 1][0]); //start维护重叠区间的最小值
if (intervals[i][1] < start) {
result.push_back({start, end});
end = intervals[i][1];
}
}
start = min(start, intervals[0][0]); //遍历完成后需要将最左边的区间也加入进去
result.push_back({start, end});
return result;
}
};
下面是卡哥的题解,他是按照左边界排序的:
那么我按照左边界排序,排序之后局部最优:每次合并都取最大的右边界,这样就可以合并更多的区间了,整体最优:合并所有重叠的区间。
局部最优可以推出全局最优,找不出反例,试试贪心。
按照左边界从小到大排序之后,如果 intervals[i][0] < intervals[i - 1][1]
即intervals[i]左边界 < intervals[i - 1]
右边界,则一定有重复,因为intervals[i]的左边界一定是大于等于intervals[i - 1]
的左边界。
即:intervals[i]
的左边界在intervals[i - 1]
左边界和右边界的范围内,那么一定有重复!
class Solution {
public:
// 按照区间左边界从小到大排序
static bool cmp (const vector<int>& a, const vector<int>& b) {
return a[0] < b[0];
}
vector<vector<int>> merge(vector<vector<int>>& intervals) {
vector<vector<int>> result;
if (intervals.size() == 0) return result;
sort(intervals.begin(), intervals.end(), cmp);
bool flag = false; // 标记最后一个区间有没有合并
int length = intervals.size();
for (int i = 1; i < length; i++) {
int start = intervals[i - 1][0]; // 初始为i-1区间的左边界
int end = intervals[i - 1][1]; // 初始i-1区间的右边界
while (i < length && intervals[i][0] <= end) { // 合并区间
end = max(end, intervals[i][1]); // 不断更新右区间
if (i == length - 1) flag = true; // 最后一个区间也合并了
i++; // 继续合并下一个区间
}
// start和end是表示intervals[i - 1]的左边界右边界,所以最优intervals[i]区间是否合并了要标记一下
result.push_back({start, end});
}
// 如果最后一个区间没有合并,将其加入result
if (flag == false) {
result.push_back({intervals[length - 1][0], intervals[length - 1][1]});
}
return result;
}
};
总结
- 划分字母区间的题解很巧妙,用一个数组维护字母出现的最大的下标
- 合并区间是自己不断提交不算修改bug出来的,思路和无重叠区间类似