1. 离散化
离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。离散化本质上可以看成是一种哈希。
整个值域跨度很大,但用到的数很稀疏。
如
a[]:1, 3, 100, 2000, 50000
↓ ↓ ↓ ↓ ↓
0 1 2 3 4
- a中可能存在重复元素——去重
- 如何算出
a[i]
离散化后的值是多少——二分
先排序去重后二分
模板
unique
函数用于将容器中的连续重复元素合并,并返回指向新范围末尾之后的迭代器。然后,erase
函数用于移除从新范围末尾开始到容器末尾的元素。
vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去掉重复元素
// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
int l = 0, r = alls.size() - 1;
while (l < r)
{
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1; // 映射到1, 2, ...n
}
例题
区间和
用一种保序离散化的方式,把所有用到的下标映射成从1开始的自然数。
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
const int N = 300010; //n次插入和m次查询相关数据量的上界
int n, m;
int a[N];//存储坐标插入的值
int s[N];//存储数组a的前缀和
vector<int> alls; //存储(所有与插入和查询有关的)坐标
vector<pair<int, int>> add, query; //存储插入和询问操作的数据
int find(int x) { //返回的是输入的坐标的离散化下标
int l = 0, r = alls.size() - 1;
while (l < r) {
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1;
}
int main() {
scanf("%d%d", &n, &m);
for (int i = 1; i <= n; i++) {
int x, c;
scanf("%d%d", &x, &c);
add.push_back({x, c});
alls.push_back(x);
}
for (int i = 1; i <= m; i++) {
int l , r;
scanf("%d%d", &l, &r);
query.push_back({l, r});
alls.push_back(l);
alls.push_back(r);
}
//排序,去重
sort(alls.begin(), alls.end());
alls.erase(unique(alls.begin(), alls.end()), alls.end());
//执行前n次插入操作
for (auto item : add) {
int x = find(item.first);
a[x] += item.second;
}
//前缀和
for (int i = 1; i <= alls.size(); i++) s[i] = s[i-1] + a[i];
//处理后m次询问操作
for (auto item : query) {
int l = find(item.first);
int r = find(item.second);
printf("%d\n", s[r] - s[l-1]);
}
return 0;
}
2. 区间合并
- 按区间左端点排序
- 包含,交集,无交集三种关系
例题
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
typedef pair<int, int> PII;
const int N = 100010;
int n;
vector<PII> segs;
void merge(vector<PII> &segs)
{
vector<PII> res;
//将区间按左端点排序
sort(segs.begin(), segs.end()); //pair的sort排序是默认先按第一个后按第二个排序
//将st(start)和ed(end)初始化为负无穷
int st = -2e9, ed = -2e9; //int的最小值为−2147483647,可以取−2e9代替,当然这道题的数据范围是-+1e9
for (auto seg: segs)
{
if (ed < seg.first) //如果当前维护的区间严格在遍历的这个区间的左边
{
if (st != -2e9) res.push_back({st, ed}); //将它放入结果中
st = seg.first, ed = seg.second; //当前维护的区间更新为正在遍历的这个区间
}
else ed = max(ed, seg.second); //如果是有交集的,右端取大的那个
}
//如果遍历到最后一个,上面的遍历进入的是else没有加入res,就把最后这个区间加入结果res
if (st != -2e9) res.push_back({st, ed});
segs = res; //将合并后的区间res重新赋值给segs
}
int main()
{
cin >> n;
for (int i = 0; i < n; i++)
{
int l, r;
cin >> l >> r;
segs.push_back({l, r});
}
merge(segs);
cout << segs.size() << endl;
}