题目
思路1
感谢@qwaszx 的博客提供的思路。可以类比奇怪的厨师,我们存一个右端点。
处理异或的最好数据结构就是 trie \texttt{trie} trie 树。把 t r i e \tt{trie} trie 树建出来之后,对于某个右端点,第 k k k 大的值是可求的,利用子树大小即可。
发现这种情况下,会有 l > r l>r l>r 的情况。所以我们将 m m m 扩大一倍—— [ l , r ] [l,r] [l,r] 就会被 [ l , r ] [l,r] [l,r] 和 [ r , l ] [r,l] [r,l] 计算两次。
那么 l = r l=r l=r 的情况呢?这种情况的值是 0 0 0 ,是不会取到的。倘若取到了,算法已经可以停止了,以后都是零。
然后就没了?
代码1
#include <cstdio>
#include <iostream>
#include <vector>
#include <queue>
using namespace std;
inline long long readint(){
long long a = 0; char c = getchar(), f = 1;
for(; c<'0' or c>'9'; c=getchar())
if(c == '-') f = -f;
for(; '0'<=c and c<='9'; c=getchar())
a = (a<<3)+(a<<1)+(c^48);
return (long long)f*a;
}
inline void writeint(long long x){
if(x < 0) putchar('-'), x = -x;
if(x > 9) writeint(x/10);
putchar(x%10+'0');
}
const int MaxN = 500005, LogA = 32;
int n, m;
struct Node{
Node* son[2]; int size;
Node(){ size = 0, son[0] = son[1] = nullptr; }
};
Node* root = new Node();
void insert(long long x){
Node* o = root;
for(int i=LogA; ~i; --i){
if(o->son[x>>i&1] == nullptr)
o->son[x>>i&1] = new Node();
o = o->son[x>>i&1], ++ o->size;
}
}
long long query(long long x,int k){
Node* o = root; long long res = 0;
for(int i=LogA,d,lsize; ~i; --i){ d = (x>>i&1)^1;
lsize = (o->son[d] == nullptr ? 0 : o->son[d]->size);
if(k <= lsize) o = o->son[d], res |= 1ll<<i;
else k -= lsize, o = o->son[d^1];
}
return res;
}
long long s[MaxN];
void input(){
n = readint(), m = readint();
insert(s[0] = 0);
for(int i=1; i<=n; ++i){
s[i] = s[i-1]^readint();
insert(s[i]);
}
}
struct Status{
int r, x; long long val;
Status(int R,int X):r(R),x(X){
val = query(s[r],x);
}
bool operator<(const Status &that)const{
return val < that.val;
}
};
priority_queue<Status> pq;
void solve(){
for(int i=0; i<=n; ++i)
pq.push(Status(i,1));
long long ans = 0;
for(int i=1; i<=(m<<1); ++i){
Status t = pq.top(); pq.pop();
ans += t.val;
if(t.x+1 <= n)
pq.push(Status(t.r,t.x+1));
}
writeint(ans>>1), putchar('\n');
}
int main(){
input(), solve();
return 0;
}
思路2
建议做这道题,数据范围略有不同,故算法设计的重心亦不同。
这篇题解写的很好,我在这里稍微补充几句,使得它变得更加 w e a k e r − k i n d l y \tt weaker-kindly weaker−kindly ,用以某新手复习。
代码分成两步:
- 求出第 k k k 大的异或值。
- 求出前 k k k 大的和。
第一步,题解中使用了比较巧妙的方法,故某新手在此介绍二分法。二分最终结果 x 0 x_0 x0 ,枚举一个 a i a_i ai ,在 t r i e \tt trie trie 中查有多少个数与 a i a_i ai 异或起来不小于 x 0 x_0 x0 ,即 严格大于 x 0 − 1 x_0-1 x0−1 ,这是容易做到的。复杂度 O ( n log 2 a ) \mathcal O(n\log^2 a) O(nlog2a) 。
第二步,考虑 严格大于 第
k
k
k 大的异或和的值。这跟 第一步
不是一样的吗?枚举一个
a
i
a_i
ai ,同样的,有
log
a
\log a
loga 棵子树内的值都满足条件。恰为第
k
k
k 大的异或和的值,可以作差分求数量。
现在有个大问题,设 t r i e \tt trie trie 的某棵子树为 T T T ,则我们得计算
∑ y ∈ T ( x ⊕ y ) \sum_{y\in T}(x\oplus y) y∈T∑(x⊕y)
然鹅,异或可以拆成很多二进制位单独考虑,所以我们只需要对每棵子树维护一个 f ( T , d ) f(T,d) f(T,d) ,表示子树 T T T 中有多少个数在第 d d d 位为一。时间会爆吗?好像不会,一次插入在每个节点上进行 O ( log a ) \mathcal O(\log a) O(loga) 步操作,总复杂度 O ( n log 2 a ) \mathcal O(n\log^2 a) O(nlog2a) 。
可是,会爆空间。没错,这道题卡空间!使用优化技巧,将 a a a 排序,则每棵子树代表原数列的一个区间,所以可以只做前缀和。空间复杂度 O ( n log a ) \mathcal O(n\log a) O(nloga) 。
然后就做完了呢。我想了一年都没想出来,我好弱啊……
#include <cstdio>
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
typedef long long int_;
inline int_ readint(){
int_ a = 0; char c = getchar(), f = 1;
for(; c<'0'||c>'9'; c=getchar())
if(c == '-') f = -f;
for(; '0'<=c&&c<='9'; c=getchar())
a = (a<<3)+(a<<1)+(c^48);
return a*f;
}
const int lqy = 1000000007;
const int MaxN = 100005, LogA = 30;
int rt, sum[MaxN][LogA][2];
namespace Trie{
struct Node{
int son[2], l, r;
} node[MaxN*LogA<<2];
int cntNode = 0;
int newNode(){
int &t = ++ cntNode;
for(int i=0; i<2; ++i)
node[t].son[i] = 0;
return t;
}
void insert(int x,int id,int &o=rt,int d=LogA-1){
if(o == 0)
o = newNode(), node[o].l = id-1;
node[o].r = id; if(d == -1) return ;
insert(x,id,node[o].son[x>>d&1],d-1);
}
// 求 \sum_{y^x>road} 1
int query_cnt(int road,int x,int o=rt,int d=LogA-1){
if(o == 0) return 0; // 不存在的点
if(d == -1) return 0; // 严格小于号
int res = 0, t = x>>d&1, r = road>>d&1;
if(!r){
int xez = node[o].son[t^1];
res += node[xez].r-node[xez].l;
}
res += query_cnt(road,x,node[o].son[t^r],d-1);
return res%lqy;
}
// 求 \sum_{y^x>road} (x^y)
int query_sum(int road,int x,int o=rt,int d=LogA-1){
if(o == 0) return 0; // 不存在的点
if(d == -1) return 0; // 严格小于号
int res = 0, t = x>>d&1, r = road>>d&1;
if(!r) for(int i=0; i<LogA; ++i){
long long jb = node[o].son[t^1];
jb = sum[node[jb].r][i][(x>>i&1)^1]
-sum[node[jb].l][i][(x>>i&1)^1];
res = (res+(jb<<i)%lqy)%lqy;
}
res += query_sum(road,x,node[o].son[t^r],d-1);
return res%lqy;
}
} using namespace Trie;
int a[MaxN];
int main(){
int n = readint();
int_ k = readint()<<1;
for(int i=1; i<=n; ++i)
a[i] = readint();
sort(a+1,a+n+1);
for(int i=1; i<=n; ++i){
insert(a[i],i);
for(int j=0; j<LogA; ++j){
sum[i][j][0] = sum[i-1][j][0];
sum[i][j][1] = sum[i-1][j][1];
++ sum[i][j][a[i]>>j&1];
}
}
int L = 0, R = (1<<LogA)-1;
int_ ppl; int mid;
while(L != R){
mid = (L+R+1)>>1, ppl = 0;
for(int i=1; i<=n; ++i)
ppl += query_cnt(mid-1,a[i]);
if(ppl >= k) L = mid; else R = mid-1;
}
ppl = k;
for(int i=1; i<=n; ++i)
ppl -= query_cnt(L,a[i]);
int ans = ppl%lqy*L%lqy;
for(int i=1; i<=n; ++i)
ans = (ans+query_sum(L,a[i]))%lqy;
printf("%lld\n",((lqy+1ll)>>1)*ans%lqy);
return 0;
}