[离散化+模板] 离散化模板

最新推荐文章于 2023-12-22 20:59:42 发布

Ypuyu

最新推荐文章于 2023-12-22 20:59:42 发布

阅读量330

点赞数

分类专栏： # 离散化文章标签：离散化算法模板

本文链接：https://blog.csdn.net/yl_puyu/article/details/109174665

版权

离散化专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

- 0. 前言
- 1. 离散化

0. 前言

当数据值域很大，但个数很少的时候，我们无法采用哈希表的方式来映射，会爆内存限制。故我们需要将这些数来以某种方式映射到连续下标的数组中。

离散化的本质，是映射，将间隔很大的点，映射到相邻的数组元素中。减少对空间的需求，也减少计算量。

例如：

数组 a[] 1, 3, 100, 200, 50000
映射为
数组 b[] 0, 1, 2, 3, 4

由于数组 a 中可能有重复元素，需要去重

vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end());   // 去掉重复元素

离散化不需要知道具体数值，但保证相对位置不变，即离散化是保序的。跟输入顺序无关，而是数据的数值大小。

找到离散化后映射到的数组下标位置，因为是有序的，所以可以采用二分查找：

// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
    int l = 0, r = alls.size() - 1;
    while (l < r)
    {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1; // 映射到1, 2, ...n
}

1. 离散化

Biu

主要思想：

vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end());   // 去掉重复元素

// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
    int l = 0, r = alls.size() - 1;
    while (l < r)
    {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1; // 映射到1, 2, ...n
}

在这里插入图片描述

#include <iostream>
#include <vector>
#include <algorithm>

using namespace std;

typedef pair<int, int> PII;

const int N = 3e5+5;

int n, m;
int a[N], s[N];     // a存储所有输入下标离散化后的位置
vector<int> alls;   // alls存储所有待离散化的值
vector<PII> add, q; // add存储添加的{x,c}，q存储查询区间{l,r}

// 整数二分模板一，二分红色点，找不到将返回大于x的第一个下标
// 找到了返回离散化位置的下标 +1 方便处理前缀和
int find(int x) {                       
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + r >> 1;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1;
}

vector<int>::iterator unique(vector<int> &a) {  // std::unique的手写实现
    int j = 0;
    for (int i = 0; i < a.size(); ++i) {
        if (!i || a[i] != a[i - 1])
            a[j ++] = a[i];
    }
    // a[0] --- a[j - 1] 就是a中所有不同的数
    return a.begin() + j;
}

int main() {
    cin >> n >> m;
    for (int i = 0; i < n; ++i) {
        int x, c;
        cin >> x >> c;

        add.push_back({x, c});  // 输入添加位置和添加的数
        alls.push_back(x);      // x作为下标，值域大，需要离散化
    }
    for (int i = 0; i < m; ++i) {
        int l, r;
        cin >> l >> r;
        
        q.push_back({l, r});    // 输入查询区间l,r
        alls.push_back(l);      // 两者作为下标，值域大，需要离散化
        alls.push_back(r);
    }
    
    sort(alls.begin(), alls.end());         // 排序、去重
    alls.erase(unique(alls), alls.end());
    
    for (auto e:add) {          
        int x = find(e.first);  // 找到离散化后的下标x，下标从1开始
        a[x] += e.second;       // 在x位置添加数c
    }
    
    for (int i = 1; i <= alls.size(); ++i) s[i] = s[i - 1] + a[i];  // 做a数组的前缀和
    
    for (auto e:q) {
        int l = find(e.first), r = find(e.second); // 找到查询区间离散化后的左右下标
        cout << s[r] - s[l - 1] << endl;    // 求区间和
    }
    return 0;
}

Ypuyu

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
[离散化+模板] 离散化模板

文章目录0. 前言1. 离散化0. 前言当数据值域很大，但个数很少的时候，我们无法采用哈希表的方式来映射，会爆内存限制。故我们需要将这些数来以某种方式映射到连续下标的数组中。离散化的本质，是映射，将间隔很大的点，映射到相邻的数组元素中。减少对空间的需求，也减少计算量。例如：数组 a[] 1, 3, 100, 200, 50000映射为数组 b[] 0, 1, 2, 3, 4由于数组 a 中可能有重复元素，需要去重vector<int> alls; // 存储所有待离散化的值
复制链接

扫一扫