离散化

什么是离散化:

离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。

再通俗一点:

离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小

概述:

离散化是程序设计中一个常用的技巧,它可以有效的降低时间复杂度。其基本思想就是在众多可能的情况中,只考虑需要用的值。离散化可以改进一个低效的算法,甚至实现根本不可能实现的算法。要掌握这个思想,必须从大量的题目中理解此方法的特点。例如,在建造线段树空间不够的情况下,可以考虑离散化。

举几个例子:

原数据:1,999,100000,15;处理后:1,3,4,2;

原数据:{100,200},{20,50000},{1,400};

处理后:{3,4},{2,6},{1,5};

什么时候可以用离散化:

当数据只与它们之间的相对大小有关,而与具体是多少无关时,可以进行离散化。

从上面的例子我们也可以看出,离散化就是使离散的点(差距很大的数值)转换成更加紧密的点。(也即数组下标)这样就可以极大的缩小空间复杂度和时间复杂度,且不改变原来的属性。即我原来比你大,离散化后仍然比你大,只不过差距变小了而已。

常见的离散化:

第一种:原来相等的值离散化后仍然相等。那么在对原序列进行排序后,进行去重操作即可。这个操作并不需要我们来实现,C++ <algorithm>库中的unique可以帮我们完成,具体看代码。去重之后呢,利用upper_bound或lower_bound函数就可以完成从值到下标的离散化了,这里两个函数都用一下,让大家感受一下区别。(排序和去重是对原序列的副本进行的操作 最后离散化修改的才是原序列 对于lower_bound和upper_bound的简要介绍:https://blog.csdn.net/xiji333/article/details/87627628)

(这个例子中 n=5 5个数分别为:1099 99 1099 1 10000)

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;

int n;	//原序列长度
int a[1005];//原序列
int len;	//去重后的序列长度
int f[1005];//原序列的副本

int main()
{
	scanf("%d",&n);
	for(int i=0;i<n;i++)
	{
		scanf("%d",&a[i]);
		f[i]=a[i];
	}
	sort(f,f+n);//排序
	for(int i=0;i<n;i++)
		printf("%-4d ",a[i]);
	printf("\n");
	len=unique(f,f+n)-f;//去重后的序列长度
	for(int i=0;i<n;i++)	//离散化
		a[i]=lower_bound(f,f+len,a[i])-f;
	for(int i=0;i<n;i++)//用lower_bound 离散化后的结果
		printf("%-4d ",a[i]);
	printf("\n");
	for(int i=0;i<n;i++)
		f[i]=a[i];
	sort(f,f+n);
	len=unique(f,f+n)-f;
	for(int i=0;i<n;i++)	//离散化
		a[i]=upper_bound(f,f+len,a[i])-f;
	for(int i=0;i<n;i++)//用upper_bound 离散化后的结果
		printf("%-4d ",a[i]);
	printf("\n");
	return 0;
}

运行结果为:

我们可以清楚的看到原序列经过离散化后的结果。(其实就是变成了数组下标 只不过相对大小关系不变)那lower_bound和upper_buond的区别呢?假设去重后的序列的长度为len,lower_bound离散化后的结果是0-len-1,而upper_bound离散化后的结果是1-len。

第二种:原来相等的值,离散化后不相等。那不进行去重操作就好了,但是要新增一个id属性,大家看代码和运行结果可以体会一下id的作用。(鉴于upper_bound和lower_bound的区别上面已经演示过了 这里就不再赘述了)

(用的数据同上 n=5 1099 99 1099 1 10000)

#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;

struct node
{
	int val,id;
	bool operator < (const node &a)const//重载小于运算符用来排序
	{
		return val<a.val;	//值小的在前面
	}
};

int n;	//序列长度
node a[1005];//原序列
int f[1005];//离散化后的序列

int main()
{
	scanf("%d",&n);
	for(int i=0;i<n;i++)
	{
		scanf("%d",&a[i]);
		a[i].id=i+1;
	}
	sort(a,a+n);
	for(int i=0;i<n;i++)
		f[a[i].id]=i+1;
	for(int i=0;i<n;i++)
		printf("%-5d",a[i].id);
	printf("\n");
	for(int i=0;i<n;i++)
		printf("%-5d",a[i].val);
	printf("\n");
	for(int i=0;i<n;i++)
		printf("%-5d",f[a[i].id]);
	printf("\n");
	return 0;
}

运行结果:

我们可以看到:1->1、99->2、1099->3、1099->4,10000->5,通过id这个属性我们可以直接从序列f中得到离散化后的值。(据说这种离散化方法不常用 就了解一下吧)

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值