离散化和区间合并

最新推荐文章于 2024-10-16 19:20:14 发布

Evanhhhh

最新推荐文章于 2024-10-16 19:20:14 发布

阅读量191

点赞数 1

分类专栏：算法基础课 # 基础算法文章标签： c++ 算法

本文链接：https://blog.csdn.net/nai_long/article/details/132236190

版权

算法基础课同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

基础算法

6 篇文章 0 订阅

订阅专栏

文章目录

1. 离散化
- 模板
- 例题
2. 区间合并
- 例题

1. 离散化

离散化，把无限空间中有限的个体映射到有限的空间中去，以此提高算法的时空效率。通俗的说，离散化是在不改变数据相对大小的条件下，对数据进行相应的缩小。离散化本质上可以看成是一种哈希。

整个值域跨度很大，但用到的数很稀疏。

如

a[]：1, 3, 100, 2000, 50000
↓ ↓ ↓ ↓ ↓
0 1 2 3 4

a中可能存在重复元素——去重
如何算出a[i]离散化后的值是多少——二分

先排序去重后二分

模板

unique 函数用于将容器中的连续重复元素合并，并返回指向新范围末尾之后的迭代器。然后，erase 函数用于移除从新范围末尾开始到容器末尾的元素。

vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end());   // 去掉重复元素

// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
    int l = 0, r = alls.size() - 1;
    while (l < r)
    {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1; // 映射到1, 2, ...n
}

例题

区间和
用一种保序离散化的方式，把所有用到的下标映射成从1开始的自然数。
在这里插入图片描述

#include <iostream>
#include <vector>
#include <algorithm>

using namespace std;
const int N = 300010; //n次插入和m次查询相关数据量的上界
int n, m;
int a[N];//存储坐标插入的值
int s[N];//存储数组a的前缀和
vector<int> alls;  //存储（所有与插入和查询有关的）坐标
vector<pair<int, int>> add, query; //存储插入和询问操作的数据

int find(int x) { //返回的是输入的坐标的离散化下标
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1;
}

int main() {
    scanf("%d%d", &n, &m);
    for (int i = 1; i <= n; i++) {
        int x, c;
        scanf("%d%d", &x, &c);
        add.push_back({x, c});
        alls.push_back(x);
    }
    for (int i = 1; i <= m; i++) {
        int l , r;
        scanf("%d%d", &l, &r);
        query.push_back({l, r});
        alls.push_back(l);
        alls.push_back(r);
    }
   //排序，去重
    sort(alls.begin(), alls.end());
    alls.erase(unique(alls.begin(), alls.end()), alls.end());
    //执行前n次插入操作
    for (auto item : add) {
        int x = find(item.first);
        a[x] += item.second;
    }
    //前缀和
    for (int i = 1; i <= alls.size(); i++) s[i] = s[i-1] + a[i];
    //处理后m次询问操作
    for (auto item : query) {
        int l = find(item.first);
        int r = find(item.second);
        printf("%d\n", s[r] - s[l-1]);
    }

    return 0;
}

2. 区间合并

按区间左端点排序
包含，交集，无交集三种关系

例题

区间合并

#include <iostream>
#include <vector>
#include <algorithm>

using namespace std;

typedef pair<int, int> PII;
const int N = 100010;

int n;
vector<PII> segs;

void merge(vector<PII> &segs)
{
    vector<PII> res;
    
    //将区间按左端点排序
    sort(segs.begin(), segs.end()); //pair的sort排序是默认先按第一个后按第二个排序
    
    //将st(start)和ed(end)初始化为负无穷
    int st = -2e9, ed = -2e9; //int的最小值为−2147483647，可以取−2e9代替，当然这道题的数据范围是-+1e9
    for (auto seg: segs)
    {
        if (ed < seg.first) //如果当前维护的区间严格在遍历的这个区间的左边
        {
            if (st != -2e9) res.push_back({st, ed}); //将它放入结果中
            st = seg.first, ed = seg.second; //当前维护的区间更新为正在遍历的这个区间
        }
        else ed = max(ed, seg.second); //如果是有交集的，右端取大的那个
    }
    
    //如果遍历到最后一个，上面的遍历进入的是else没有加入res，就把最后这个区间加入结果res
    if (st != -2e9) res.push_back({st, ed});
    
    segs = res; //将合并后的区间res重新赋值给segs
}

int main()
{
    cin >> n;
    for (int i = 0; i < n; i++)
    {
        int l, r;
        cin >> l >> r;
        segs.push_back({l, r});
    }
    
    merge(segs);
    
    cout << segs.size() << endl;
}