定义:
当有些数据因为本身很大或者类型不支持,自身无法作为数组的下标来方便地处理,而影响最终结果的只有元素之间的相对大小关系时,我们可以将原来的数据按照从大到小编号来处理问题,即离散化。
理解:
区间范围很大(无法为数组下标)但能用的区间很离散,我们把这些离散的区间放在一起存起来,就是离散化过程。
步骤:
1.排序:(排序是为了查找(二分)
一些需要用离散化的题目可能也需要排序)
2.去重
3.查找:(离散化就是用数组下标来表示原来的数据,通过二分查找来返回数据在数组中的下标)
这里重点说一下去重的目的:
例如:数据为(1,4,222,222,10000)这里离散化的过程中,(数据->数组下标)
1->[0]
,4->[1]
,222->[2]或[3]
,10000->[4]
。这里222查找离散化后对应的下标就产生了歧义。
离散化的模板代码实现:
//这里用的是STL库
sort(v.begin(), v.end()); //排序过程
v.erase(unique(v.begin(), v.end()), v.end()); //去重过程
lower_bound(v.begin(), v.end(), x) - v.begin(); //二分查找x过程
例题:
假定有一个无限长的数轴,数轴上每个坐标上的数都是 0。
现在,我们首先进行 n 次操作,每次操作将某一位置 x 上的数加 c。
接下来,进行 m 次询问,每个询问包含两个整数 l 和 r,你需要求出在区间 [l,r] 之间的所有数的和。
输入格式
第一行包含两个整数 n 和 m。
接下来 n 行,每行包含两个整数 x 和 c。
再接下来 m 行,每行包含两个整数 l 和 r。
输出格式
共 m 行,每行输出一个询问中所求的区间内数字和。
思路:
区间无限长超出数组下标,但可用区间很稀疏,故用离散化。
把出现的区间全部离散化用
alls
数组存(大的区间化成小的区间),未出现的区间为无用区间(c为零)。
离散化后区间就可以alls
用数组下标表示,对区间加上c
用数组a
存来存,用数组s
来求前缀和(a
,s
都用alls
数组的下标)因为alls数组下标对应着区间上的值。主要就是对出现区间的处理
实现代码:
#include<iostream>
#include<algorithm>
#include<vector>
using namespace std;
typedef pair<int, int> PII;
const int N = 3e5 + 10;
int a[N], s[N];
vector<PII> add,que;
vector<int> alls;
int find(int x) //返回alls的下标
{
return lower_bound(alls.begin(), alls.end(), x) - alls.begin() + 1; // 二分查找
}
int main()
{
int n, m;
cin >> n >> m;
while (n--)
{
int x, y;
cin >> x >> y;
add.push_back({ x,y });
alls.push_back(x); // 出现的区间
}
while (m--)
{
int l,r;
cin >> l >> r;
que.push_back({ l,r });
alls.push_back(l); // 出现区间
alls.push_back(r); // 出现区间
}
sort(alls.begin(), alls.end()); // 排序
alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去重
for (int i = 0; i < add.size(); i++)
{
int x = find(add[i].first); // 返回alls下标
a[x] += add[i].second; // 用a来存对应区间上的c
}
for (int i = 1; i <= alls.size(); i++)
s[i] += a[i] + s[i - 1]; // 对应区间的前缀和
for (int i = 0; i < que.size(); i++)
{
int l = find(que[i].first), r = find(que[i].second);
cout << s[r] - s[l-1] << endl;
}
}