数据预处理—离散化

离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。

通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。

举个栗子:

四个数:1,999999,345,34

离散化完后为:1,4,3,2

也就是说对于给的数,我们不需要知道他的值具体是多少,只需要知道他们之间的相对大小。

这里介绍离散化的两种方法:

一、

#include<bits/stdc++.h>
using namespace std;
const int N = 1e5+10;
int t[N],a[N],n;
int main()
{
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%d",&a[i]);
		t[i]=a[i];
	}
	sort(t+1,t+1+n);
	int m=unique(t+1,t+1+n)-(t+1);
	for(int i=1;i<=n;i++)
	a[i]=lower_bound(t+1,t+m+1,a[i])-t;
}

unique函数是C++自带的函数,对一个数组中的元素去重,在后面减去数组的首地址即得去重后的元素个数。

二、

#include<bits/stdc++.h>
using namespace std;
const int N=1e5+10; 
struct node{
	int v,id;
	bool operator < (const node a)const{
	   return v<a.v;
	}
}a[N]; 
int n,rank[N];
int main()
{
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%d",&a[i].v);
		a[i].id=i;
	}
	sort(a+1,a+1+n);
	for(int i=1;i<=n;i++){
		rank[a[i].id]=i;
	}
}

这个方法不能用于有重复元素的例子中。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值