题目分析
神仙题。
我们考虑一下一个特定的数对(A,B),原来在A位置和在B位置的数在k次交换之后,会在哪些位置。可以发现,如果它们没有落在A位置和B位置,落在其他位置的概率是一样的,那么我们把所有其他位置都记做C位置。
初始状态是(A,B),现在我们要算出结束状态分别是(A,B),(C,A),(B,A),(C,B),(A,C),(B,C),(C,C)的方案数。
考虑矩阵乘法,可以构造转移矩阵表示一次交换操作之后到达某个状态的方案数。
行代表起始状态列表示终止状态,从0号到6号状态分别是(A,B),(C,A),(B,A),(C,B),(A,C),(B,C),(C,C),转移矩阵应该是:
C2n−2110010n−2C2n−2+(n−3)0110110C2n−2110001n−2C2n−2+(n−3)01101n−20C2n−2+(n−3)11n−20011C2n−2+(n−3)10n−30n−3n−3n−3C2n−2+2(n−4)+1
C
n
−
2
2
n
−
2
1
0
0
n
−
2
0
1
C
n
−
2
2
+
(
n
−
3
)
0
1
1
0
n
−
3
1
0
C
n
−
2
2
n
−
2
n
−
2
0
0
0
1
1
C
n
−
2
2
+
(
n
−
3
)
0
1
n
−
3
0
1
1
0
C
n
−
2
2
+
(
n
−
3
)
1
n
−
3
1
0
0
1
1
C
n
−
2
2
+
(
n
−
3
)
n
−
3
0
1
0
1
1
1
C
n
−
2
2
+
2
(
n
−
4
)
+
1
好的,现在我们枚举其中的B,假设当前B位置的权值为 x x ,然后考虑A的情况。用树状数组维护比小的数的个数 a a ,比小的所有数前面的位置数和 fa f a ,比 x x 小的所有数后面(除去B位置以外)的位置数和。同时算出对应的比 x x 大的数的这些相关量, fb f b , gb g b 。
设矩阵的 k k 次幂的第0行i列为,那么我就知道了统计答案的方法:
(A,B):b∗t(0) ( A , B ) : b ∗ t ( 0 )
(C,A):(a∗(n−B)+b∗(B−2))∗t(1)∗1n−2 ( C , A ) : ( a ∗ ( n − B ) + b ∗ ( B − 2 ) ) ∗ t ( 1 ) ∗ 1 n − 2
(B,A):a∗t(2) ( B , A ) : a ∗ t ( 2 )
(C,B):(fb+ga)∗t(3)∗1n−2 ( C , B ) : ( f b + g a ) ∗ t ( 3 ) ∗ 1 n − 2
(A,C):(a∗(B−2)+b∗(n−B))∗t(4)∗1n−2 ( A , C ) : ( a ∗ ( B − 2 ) + b ∗ ( n − B ) ) ∗ t ( 4 ) ∗ 1 n − 2
(B,C):(gb+fa)∗t(5)∗1n−2 ( B , C ) : ( g b + f a ) ∗ t ( 5 ) ∗ 1 n − 2
枚举完了B后,再统一算 (C,C) ( C , C ) 的贡献。
(C,C):C2n∗12∗t(6) ( C , C ) : C n 2 ∗ 1 2 ∗ t ( 6 )
呃,理解就不写了,不然今天就废了……反正解释一下要乘以 1n−2 1 n − 2 的原因,是抵消掉矩阵乘法里已经计算过的选位置的影响。
代码
似乎还要额外考虑一下 n n <script type="math/tex" id="MathJax-Element-26">n</script>比较小的情况?但是反正过了我就懒得管了=。=
#include<bits/stdc++.h>
using namespace std;
#define RI register int
int read() {
int q=0;char ch=' ';
while(ch<'0'||ch>'9') ch=getchar();
while(ch>='0'&&ch<='9') q=q*10+ch-'0',ch=getchar();
return q;
}
typedef long long LL;
const int mod=1000000007,N=500005;
int n,K,inv,inv2,ans,w[N];LL tr[3][N];
struct matrix{int t[7][7];}re,X;
int qm(int x) {return x>=mod?x-mod:x;}
int ksm(int x,int y) {
int re=1;
for(;y;y>>=1,x=1LL*x*x%mod) if(y&1) re=1LL*re*x%mod;
return re;
}
matrix operator * (matrix a,matrix b) {
matrix c;
for(RI i=0;i<7;++i)
for(RI j=0;j<7;++j) {
c.t[i][j]=0;
for(RI k=0;k<7;++k)
c.t[i][j]=qm(c.t[i][j]+1LL*a.t[i][k]*b.t[k][j]%mod);
}
return c;
}
void build() {//矩阵乘法
for(RI i=0;i<7;++i) re.t[i][i]=1;
for(RI i=0;i<7;++i) X.t[i][i]=1LL*(n-2)*(n-3)%mod*inv2%mod;
X.t[0][1]=n-2,X.t[0][2]=1,X.t[0][5]=n-2;
X.t[1][0]=1,X.t[1][1]=qm(X.t[1][1]+n-3),X.t[1][3]=X.t[1][4]=1,X.t[1][6]=n-3;
X.t[2][0]=1,X.t[2][3]=X.t[2][4]=n-2;
X.t[3][1]=X.t[3][2]=1,X.t[3][3]=qm(X.t[3][3]+n-3),X.t[3][5]=1,X.t[3][6]=n-3;
X.t[4][1]=X.t[4][2]=1,X.t[4][4]=qm(X.t[4][4]+n-3),X.t[4][5]=1,X.t[4][6]=n-3;
X.t[5][0]=1,X.t[5][3]=X.t[5][4]=1,X.t[5][5]=qm(X.t[5][5]+n-3),X.t[5][6]=n-3;
X.t[6][1]=X.t[6][3]=X.t[6][4]=X.t[6][5]=1,X.t[6][6]=(X.t[6][6]+n+n-7)%mod;
for(RI i=K;i;i>>=1,X=X*X) if(i&1) re=re*X;
}
#define lowbit(x) (x&(-x))
void add(int o,int x,LL num) {
while(x<=n) tr[o][x]=qm(tr[o][x]+num),x+=lowbit(x);
}
LL query(int o,int x) {
LL re=0;
while(x) re=qm(re+tr[o][x]),x-=lowbit(x);
return re;
}
int main()
{
n=read(),K=read();
for(RI i=1;i<=n;++i) w[i]=read();
inv=ksm(n-2,mod-2),inv2=ksm(2,mod-2),build();
LL sumf=0,sumg=0;
for(RI i=1;i<=n;++i) {
LL a=query(0,w[i]),b=i-1-a;
LL fa=query(1,w[i]),fb=sumf-fa;
LL ga=query(2,w[i]),gb=sumg-ga;
ans=qm(ans+1LL*b*re.t[0][0]%mod);
ans=qm(ans+1LL*(a*(n-i)%mod+b*(i-2)%mod)%mod*re.t[0][1]%mod*inv%mod);
ans=qm(ans+1LL*a*re.t[0][2]%mod);
ans=qm(ans+1LL*(fb+ga)%mod*re.t[0][3]%mod*inv%mod);
ans=qm(ans+1LL*(a*(i-2)%mod+b*(n-i)%mod)%mod*re.t[0][4]%mod*inv%mod);
ans=qm(ans+1LL*(gb+fa)%mod*re.t[0][5]%mod*inv%mod);
sumf+=(LL)(i-1),sumg+=(LL)(n-i-1);
add(0,w[i],1),add(1,w[i],i-1),add(2,w[i],n-i-1);
}
ans=qm(ans+1LL*n*(n-1)%mod*inv2%mod*inv2%mod*re.t[0][6]%mod);
printf("%d\n",ans);
return 0;
}