离散化 处理区间和问题
题目来自acwing 802;
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
typedef pair<int, int> PII;
const int N = 300010;
int n, m;
int a[N], s[N];//a用来存离散化后各个下标所对应的值,s为前缀和数组
vector<int> alls; // 存所有需要离散化的数
vector<PII> add, query;// add 存插入操作,query存查询操作
int find(int x)//简单二分求离散化后所对应的下标
{
int l = 0, r = alls.size() - 1;
while (l < r)
{
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1;
}
int main()
{
cin >> n >> m;
for (int i = 0; i < n; i ++ )
{
int x, c;
cin >> x >> c;
add.push_back({x, c});//读入插入操作
alls.push_back(x);//x 为需要离散化的坐标
}
for (int i = 0; i < m; i ++ )
{
int l, r;
cin >> l >> r;
query.push_back({l, r});//查询操作的坐标
alls.push_back(l);
alls.push_back(r);//因为查询操作为两个区间端点,所以都需要离散化
}
// 去重
sort(alls.begin(), alls.end());
alls.erase(unique(alls.begin(), alls.end()), alls.end());
/*此处的做法是是对原来的数轴下标进行排序,再去重,
为什么要去重呢,因为本题提前考虑了前缀和的思想,其实很简单,
就是我们需要求出的区间内的和的两端断点不一定有元素,
提前加如需要求前缀和的两个端点,有利于我们进行二分搜索,
其实二分搜索里面我们一般假定有解的,如果没解的话需要特判,
所以提前加入了这些元素,从而导致可能出现重复元素*/
// 处理插入
for (auto item : add)
{
int x = find(item.first);
a[x] += item.second;//将离散化后的坐标 加上值
}
// 预处理前缀和
for (int i = 1; i <= alls.size(); i ++ ) s[i] = s[i - 1] + a[i];
// 处理询问
for (auto item : query)
{
int l = find(item.first), r = find(item.second);
cout << s[r] - s[l - 1] << endl;
}
return 0;
}
总结体会:
离散化的本质,是映射,将间隔很大的点,映射到相邻的数组元素中。减少对空间的需求,也减少计算量。
其实映射最大的难点是前后的映射关系,如何能够将不连续的点映射到连续的数组的下标。此处的解决办法就是开辟额外的数组存放原来的数组下标,或者说下标标志,本文是原来上的数轴上的非连续点的横坐标。
关于find数组我认为这个图足以说明一切
注:图片来自acwing