大致题意
给一个长度为n的数组ai,m byte的存储容量,K个不同的数字需要k=ceil(log2(K)) bit的容量来存储,其中1byte=8bit。现有一种压缩算法,规定L,R可以将所以在[L,R]范围外的数都删掉(相当于删掉),现要求运用该压缩算法,求最少删掉多少个数字,可以使得当前数组可以用m byte存的下。(1<=n<=100000, ai<=1e9)
思路
首先ai的数字范围比较大,要离散化一下。然后对离散化之后的数组排序,因为删除数字和大小相关顺序无关。现在求一个长度最长包含不同数字容量小于等于m byte的区间长度len,答案就等于ans=n-len。因为排序后只会删除两端的数据,所以符合容量大小小于等于m的一定是整段连续的,可以尺取法。
然后好久不写尺取法 ,贴一下套路性代码段。
代码
一个小注意点是,用log()是错的,log2()才行,log可能是对10取对数?
#include<bits/stdc++.h>
using namespace std;
#define maxn 400005
#define maxm 20006
#define ll long long int
#define INF 0x3f3f3f3f
#define inc(i,l,r) for(int i=l;i<=r;i++)
#define dec(i,r,l) for(int i=r;i>=l;i--)
#define mem(a) memset(a,0,sizeof(a))
#define sqr(x) (x*x)
#define inf (ll)2e18+1
int read(){
int x=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(isdigit(ch))x=x*10+ch-'0',ch=getchar();
return f*x;
}
int n,m,a[maxn],cnt[maxn],res;
vector<int>v;
void add(int x)
{
if(cnt[x]==0)res++;
cnt[x]++;
}
void del(int x){
if(cnt[x]==1)res--;
cnt[x]--;
}
int main()
{
n=read();m=read();
inc(i,1,n){a[i]=read();v.push_back(a[i]);}
sort(v.begin(),v.end());
int len=unique(v.begin(),v.end())-v.begin();
inc(i,1,n)a[i]=lower_bound(v.begin(),v.begin()+len,a[i])-v.begin()+1;
sort(a+1,a+n+1);
int l=1,r=1,ans=0;
cnt[a[1]]++;
res=1;
while(true){
while(r<=n&&(int)ceil(log2(res))*n<=m*8){
ans=max(ans,r-l+1);
add(a[++r]);
}
if((int)ceil(log2(res))*n<=m*8)break;
del(a[l++]);
}
printf("%d\n",n-ans);
return 0;
}
/*
10 1
589934963 440265648 161048053 196789927 951616256 63404428 660569162 779938975 237139603 31052281
*/