稀疏数据的离散化

离散化指的是,如果存在数据范围比较大,例如十的负九次方到十的九次方之间,然而数据比较稀疏,例如只有甚至几个下标存放了数据。此时可以将下标进行离散化,压缩数据数据范围

核心:

离散化:离散化的核心就是用c++中的vector或者java中的list。因为数据范围大的话,下标分散的区间特别开,而我们只需要将每一次对某一个下标的操作插入到vector或者list中,使得下标映射为0—n之间。(vector和list插入操作时都是顺序插入的),从而达到压缩数据范围的目的

步骤:

  1. 将每一个对下标的操作插入到vector中
  2. 对vector进行排序去重操作
  3. 利用二分,查找每一个下标对应的vector中的下标,找到映射的下标
  4. 然后以映射后下标作为实际操作的下标,进行相关题目的操作

例子:

假定有一个无限长的数轴,数轴上每个坐标上的数都是0。

现在,我们首先进行 n 次操作,每次操作将某一位置x上的数加c。

接下来,进行 m 次询问,每个询问包含两个整数l和r,你需要求出在区间[l, r]之间的所有数的和。

输入格式

第一行包含两个整数n和m。

接下来 n 行,每行包含两个整数x和c。

再接下里 m 行,每行包含两个整数l和r。

输出格式

共m行,每行输出一个询问中所求的区间内数字和。

数据范围

−109≤x≤109

,
1≤n,m≤105,
−109≤lr≤109,
−10000≤c≤10000

输入样例:
3 3
1 2
3 6
7 5
1 3
4 6
7 8
输出样例:
8
0
5

代码

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

typedef pair<int, int> PII;

const int N = 300010;
int n,m;
int a[N],s[N];

vector<int> alls;//存放待离散的下标
vector<PII> add,query;//存放操作

int find(int x){
    
    //利用二分模板一,找到最小的比x大的那个位置
    int l = 0,r = alls.size() - 1;
    while(l < r){
        
        int mid = l + r >> 1;
        if(alls[mid] >= x) r = mid;
        else l = mid + 1;
        
    }
    
    //返回r + 1是因为要计算前缀后,映射到下标从1开始
    return r + 1;
    
}

int main()
{
    cin >> n >> m;
    
    for(int i = 0;i < n;i ++){
        int x,c;
        cin >> x >> c;
        add.push_back({x,c});
        
        alls.push_back(x);  //存放插入操作用到的下标
    }
    
    for(int i = 0;i < m;i ++){
        int l,r;
        cin >> l >> r;
        query.push_back({l,r});
        
        alls.push_back(l);
        alls.push_back(r);  //存放询问操作用到的下标
    }
    
    //排序去重
    sort(alls.begin(),alls.end());
    alls.erase(unique(alls.begin(),alls.end()),alls.end());
    
    //处理插入操作
    for(auto item : add){
        int x = find(item.first);
        a[x] += item.second;
    }
    
    //求前缀和
    for(int i = 1;i <= alls.size();i ++) s[i] = s[i - 1] + a[i];
    
    //处理询问
    for(auto item : query){
        int l = find(item.first);
        int r = find(item.second);
        cout << s[r] - s[l - 1] << endl;
    }
    
    return 0;
}

由于java没有c++的unique去重函数,所以手动实现一个

注意是对有序vector或者list去重操作

因为有序的有重复的,如果当前下标是第一个数,或者当前下标对应的值与前面的值不相同,那么该下标就是重复元素的第一个。单独把这些值剔出来,就是不重复的元素

代码

vector<int>::iterator unique(vector<int> &a){
    
    int j = 0;
    for(int i = 0;i < a.size();i ++){
        if(!i || a[i] != a[i - 1]){
            a[j ++] = a[i];
        }
    }
    //a[0] 	~ a[j - 1]存放的就是不重复元素
    
    return a.begin() + j;
    
}

利用自定义unique函数的代码

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;

typedef pair<int, int> PII;

const int N = 300010;
int n,m;
int a[N],s[N];

vector<int> alls;//存放待离散的下标
vector<PII> add,query;//存放操作

int find(int x){
    
    //利用二分模板一,找到最小的比x大的那个位置
    int l = 0,r = alls.size() - 1;
    while(l < r){
        
        int mid = l + r >> 1;
        if(alls[mid] >= x) r = mid;
        else l = mid + 1;
        
    }
    
    //返回r + 1是因为要计算前缀后,映射到下标从1开始
    return r + 1;
    
}

vector<int>::iterator unique(vector<int> &a){
    
    int j = 0;
    for(int i = 0;i < a.size();i ++){
        if(!i || a[i] != a[i - 1]){
            a[j ++] = a[i];
        }
    }
    //a[0] 	~ a[j - 1]存放的就是不重复元素
    
    return a.begin() + j;
    
}

int main()
{
    cin >> n >> m;
    
    for(int i = 0;i < n;i ++){
        int x,c;
        cin >> x >> c;
        add.push_back({x,c});
        
        alls.push_back(x);  //存放插入操作用到的下标
    }
    
    for(int i = 0;i < m;i ++){
        int l,r;
        cin >> l >> r;
        query.push_back({l,r});
        
        alls.push_back(l);
        alls.push_back(r);  //存放询问操作用到的下标
    }
    
    //排序去重
    sort(alls.begin(),alls.end());
    alls.erase(unique(alls),alls.end());
    
    //处理插入操作
    for(auto item : add){
        int x = find(item.first);
        a[x] += item.second;
    }
    
    //求前缀和
    for(int i = 1;i <= alls.size();i ++) s[i] = s[i - 1] + a[i];
    
    //处理询问
    for(auto item : query){
        int l = find(item.first);
        int r = find(item.second);
        cout << s[r] - s[l - 1] << endl;
    }
    
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值