首先考虑这个问题的简化版:求 ∑(ai xor aj)∗(aj xor ak) ∑ ( a i x o r a j ) ∗ ( a j x o r a k ) ,这就等价于求 ∑j((∑ai xor aj)(∑aj xor ak)) ∑ j ( ( ∑ a i x o r a j ) ( ∑ a j x o r a k ) ) ,只考虑对于每个j如何求 ∑(ai xor aj) ∑ ( a i x o r a j ) ,由于位运算具有不同位之间不相干的性质,所以可以分别对于每一位求对于答案的贡献,可以用 sum[i][0] s u m [ i ] [ 0 ] 表示第i位为0的前缀和, sum[i][1] s u m [ i ] [ 1 ] 表示第 i i 位为1的前缀和。这样,这个简化版的问题就被我们用的复杂度给解决了。
再来考虑原题。还是进行一道转化:
这样,问题就被转化成了简化版,只要分别计算 Bit(ai,t)=0&Bit(ak,t)=1 B i t ( a i , t ) = 0 & B i t ( a k , t ) = 1 和 Bit(ai,t)=1&Bit(ak,t)=0 B i t ( a i , t ) = 1 & B i t ( a k , t ) = 0 的情况就可以了。
时间复杂度: O(nlog2n) O ( n l o g 2 n )
代码
#include<cstdio>
#include<cstring>
#include<algorithm>
#define maxn 100006
#define tt 998244353
#define LL long long
#define Bit(x,y) ((x>>y)&1)
using namespace std;
int n,ans,a[maxn],f[maxn],g[maxn],s1[36],sum[36][2];
void work(int p){
int s0=1;
for(int t=0;t<=30;t++){
memset(f,0,sizeof(f));memset(g,0,sizeof(g));memset(sum,0,sizeof(sum));
for(int i=1;i<=n;i++){
for(int j=0;j<=30;j++)(f[i]+=(LL)s1[j]*sum[j][1-Bit(a[i],j)]%tt)%=tt;
if(Bit(a[i],t)==p)for(int j=0;j<=30;j++)(sum[j][Bit(a[i],j)]+=1)%=tt;
}
memset(sum,0,sizeof(sum));
for(int i=n;i>=1;i--){
for(int j=0;j<=30;j++)(g[i]+=(LL)s1[j]*sum[j][1-Bit(a[i],j)]%tt)%=tt;
if(Bit(a[i],t)!=p)for(int j=0;j<=30;j++)(sum[j][Bit(a[i],j)]+=1)%=tt;
}
for(int i=1;i<=n;i++)(ans+=(LL)s0*f[i]%tt*g[i]%tt)%=tt;
(s0<<=1)%=tt;
}
}
int main(){
freopen("A.in","r",stdin);
freopen("A.out","w",stdout);
scanf("%d",&n);
s1[0]=1;
for(int i=1;i<=30;i++)s1[i]=(s1[i-1]<<1)%tt;
for(int i=1;i<=n;i++)scanf("%d",&a[i]);
work(1);work(0);
printf("%d\n",ans);
return 0;
}