离散化（简单哈希）（数据压缩）

最新推荐文章于 2021-09-30 17:27:31 发布

amazing550

最新推荐文章于 2021-09-30 17:27:31 发布

阅读量575

点赞数

分类专栏：算法竞赛基础文章标签：算法数据结构

本文链接：https://blog.csdn.net/m0_51746492/article/details/118736123

版权

算法竞赛基础专栏收录该内容

27 篇文章 3 订阅

订阅专栏

离散化

使用离散化的情况

假设我们现在要对一些数据进行处理，而这些数据都有几个特征：

数据数量不大：在一维数组可以开出来的大小之内。
数据的值域很大：若以这个值域进行开辟数组会开不出来。

满足这两个条件就可以使用离散化

离散化的思想

我们将这种数据进行映射，将我们要使用的不连续的值进行映射，映射到一片连续的地方。
举例：
现有5个数据分别为1，20，30000，50000000，1000000000。我们可以将其映射到，0，1，2，3，4，这5块空间中。我们用数组实现，就是有一数组a[]，a[0]=1,a[1]=20,a[2]=30000,a[3]=50000000,a[4]=1000000000。暂且将这个数组叫做散列表。

离散化的步骤

确定所用到的数据有多少个
确定这些数据具体的值
将这些值映射到散列表中
对散列表按其所代表的值升序排序
由于可能会有数据所代表的值是重复的，所以去重
按照不同问题逻辑进行设计
写一个二分查找函数，进行数据在散列表中的位置查找。

例题

ACwing802

题目描述

有一数轴，其范围从-10⁹到10⁹，我们要对其上n(0<n<10⁵)个点进行加c操作(0<c<10000),然后进行m(r0<m<10⁵)次询问询，问在l到r内所有的值的和是多少。(-10⁹ <= l <= r <= 10⁹)

题目分析

因为进行加c操作最多有10⁵个，还有m（上限10⁵）个询问，每个询问都是l，r两个值，所以我们要开辟的散列表的大小为3*10⁵。
然后去构建一个完整的散列表，这要求我们不能在刚刚输入的时候就进行数据的处理。而是要把操作存起来先去构建一个完整的散列表。
因为我们接下来要去进行散列表的排序和去重，这里利用c++的内置函数实现：

vector<int>a;//散列表
sort(a.begin(),a.end());
a.erase(unique(a.begin(),a.end()),a.end());

建议自行下去了解一下这几个函数

这一步进行完了把每个加c操作执行掉
下一步要执行的就是查询，由于这个题是区间查询，所以我们可以很清楚的想到可以利用前缀和去进行构造。

AC代码

#include <iostream>
#include <algorithm>
#include <cstring>
#include <cmath>
#include <cstdio>
#include <vector> 
#define in(x) scanf("%d",&x)
#define debug(x) cerr<<#x<<" : "<<x<<endl
using namespace std;
const int N = 300005;
const int inf = 0x3f3f3f3f;

vector<int>a;
int b[N],s[N];

typedef pair<int,int> PII;

PII add[N],query[N];

int find(int x){
	int l=0,r=a.size()-1;
	int mid = l + r + 1 >> 1;
	while(l<r){
		mid = l + r + 1 >> 1;
		if(a[mid]<=x){
			l = mid;
		}
		else{
			r = mid - 1;
		}
	}
	return l;
}


int main(){
	int n,m;	cin>>n>>m;
	for(int i=1;i<=n;i++){
		int x,c;
		cin>>x>>c;
		add[i]={x,c};
		a.push_back(x);
	}
	for(int i=1;i<=n;i++){
		int l,r;
		cin>>l>>r;
		query[i]={l,r};
		a.push_back(l);
		a.push_back(r);
	}
	sort(a.begin(),a.end());
	a.erase(unique(a.begin(),a.end()),a.end());
	for(int i=1;i<=n;i++){
		int p=find(add[i].first);
		int c=add[i].second;
		b[p]+=c;
	}
	s[0]=b[0];
	for(int i=1;i<=a.size()-1;i++){
		s[i]+=s[i-1]+b[i];
	}
	for(int i=1;i<=m;i++){
		int l=find(query[i].first);
		int r=find(query[i].second);
		cout<<s[r]-s[l-1]<<endl;
	}
	return 0;
}

amazing550

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
离散化（简单哈希）（数据压缩）

离散化目录离散化使用离散化的情况离散化的思想离散化的步骤例题ACwing802题目描述题目分析AC代码使用离散化的情况假设我们现在要对一些数据进行处理，而这些数据都有几个特征：数据数量不大：在一维数组可以开出来的大小之内。数据的值域很大：若以这个值域进行开辟数组会开不出来。满足这两个条件就可以使用离散化离散化的思想我们将这种数据进行映射，将我们要使用的不连续的值进行映射，映射到一片连续的地方。举例：现有5个数据分别为1，20，30000，50000000，1000000000。我们可
复制链接

扫一扫