0. 前言
当数据值域很大,但个数很少的时候,我们无法采用哈希表的方式来映射,会爆内存限制。故我们需要将这些数来以某种方式映射到连续下标的数组中。
离散化的本质,是映射,将间隔很大的点,映射到相邻的数组元素中。减少对空间的需求,也减少计算量。
例如:
数组 a[] 1, 3, 100, 200, 50000
映射为
数组 b[] 0, 1, 2, 3, 4
由于数组 a
中可能有重复元素,需要去重
vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去掉重复元素
离散化不需要知道具体数值,但保证相对位置不变,即离散化是保序的。跟输入顺序无关,而是数据的数值大小。
找到离散化后映射到的数组下标位置,因为是有序的,所以可以采用二分查找:
// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
int l = 0, r = alls.size() - 1;
while (l < r)
{
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1; // 映射到1, 2, ...n
}
1. 离散化
主要思想:
vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去掉重复元素
// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
int l = 0, r = alls.size() - 1;
while (l < r)
{
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1; // 映射到1, 2, ...n
}
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
typedef pair<int, int> PII;
const int N = 3e5+5;
int n, m;
int a[N], s[N]; // a存储所有输入下标离散化后的位置
vector<int> alls; // alls存储所有待离散化的值
vector<PII> add, q; // add存储添加的{x,c},q存储查询区间{l,r}
// 整数二分模板一,二分红色点,找不到将返回大于x的第一个下标
// 找到了返回离散化位置的下标 +1 方便处理前缀和
int find(int x) {
int l = 0, r = alls.size() - 1;
while (l < r) {
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1;
}
vector<int>::iterator unique(vector<int> &a) { // std::unique的手写实现
int j = 0;
for (int i = 0; i < a.size(); ++i) {
if (!i || a[i] != a[i - 1])
a[j ++] = a[i];
}
// a[0] --- a[j - 1] 就是a中所有不同的数
return a.begin() + j;
}
int main() {
cin >> n >> m;
for (int i = 0; i < n; ++i) {
int x, c;
cin >> x >> c;
add.push_back({x, c}); // 输入添加位置和添加的数
alls.push_back(x); // x作为下标,值域大,需要离散化
}
for (int i = 0; i < m; ++i) {
int l, r;
cin >> l >> r;
q.push_back({l, r}); // 输入查询区间l,r
alls.push_back(l); // 两者作为下标,值域大,需要离散化
alls.push_back(r);
}
sort(alls.begin(), alls.end()); // 排序、去重
alls.erase(unique(alls), alls.end());
for (auto e:add) {
int x = find(e.first); // 找到离散化后的下标x,下标从1开始
a[x] += e.second; // 在x位置添加数c
}
for (int i = 1; i <= alls.size(); ++i) s[i] = s[i - 1] + a[i]; // 做a数组的前缀和
for (auto e:q) {
int l = find(e.first), r = find(e.second); // 找到查询区间离散化后的左右下标
cout << s[r] - s[l - 1] << endl; // 求区间和
}
return 0;
}