思路:长度为n的序列中最小的数必须要放在1-k的位置上,然后最小的数就会把整个序列分成两半,左边可以任意 放置,右边等价于一个新的合法 序列。
那么可以得到一个
O
(
n
k
)
O(nk)
O(nk)的dp转移:
for(int i=1;i<=n;i++){
for(int j=1;j<=min(i,k);j++){
dp[i]+=dp[i-j]*C(i-1,j-1)*fac[j-1]//[1,j-1]的 位置 随意放,那么从i-1个数挑j-1个让他们全排列即可
}
}
那这个数据范围显然是过不去的。。。考虑如何优化:
简化一下转移的式子:
d
p
i
=
∑
j
=
1
k
A
i
−
1
j
−
1
d
p
i
−
j
=
∑
j
=
1
k
d
p
i
−
j
(
i
−
1
)
!
(
i
−
j
)
!
=
(
i
−
1
)
!
∑
j
=
1
k
d
p
i
−
j
(
i
−
j
)
!
dp_i=\sum_{j=1}^k A_{i-1}^{j-1}dp_{i-j}=\\\sum_{j=1}^kdp_{i-j}\frac{(i-1)!}{(i-j)~!}=\\(i-1)!\sum_{j=1}^k\frac{dp_{i-j}}{(i-j)!}
dpi=j=1∑kAi−1j−1dpi−j=j=1∑kdpi−j(i−j) !(i−1)!=(i−1)!j=1∑k(i−j)!dpi−j
显然可以前缀和快速得出答案。
#pragma GCC optimize(2)
#pragma GCC optimize(3)
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N = 1e7 + 10;
#define fi first
#define se second
#define pb push_back
#define wzh(x) cerr<<#x<<'='<<x<<endl;
int f[15];
const int mod = 998244353;
int add(int x, int y) {
x += y;
if (x >= mod)x -= mod;
if (x < 0)x += mod;
return x;
}
int mul(int x, int y) {
return 1ll * x * y % mod;
}
int sub(int x, int y) {
x = x + mod - y;
if (x >= mod)x -= mod;
return x;
}
int ksm(int x, int y, int z = 1) {
for (; y; y >>= 1, x = mul(x, x))if (y & 1)z = mul(z, x);
return z;
}
int fac[N], inv[N];
void P() {
fac[0] = 1;
for (int i = 1; i < N; i++)fac[i] = mul(fac[i - 1], i);
inv[N - 1] = ksm(fac[N - 1], mod - 2);
for (int i = N - 2; i >= 0; i--)inv[i] = mul(inv[i + 1], i + 1);
}
int di(int x, int y) {
return mul(x, ksm(y, mod - 2));
}
LL C(int x, int y) {
return mul(fac[x], mul(inv[y], inv[x - y]));
}
int n, k;
int dp[N], sum[N], in[N];
int main() {
ios::sync_with_stdio(false);
cin >> n >> k;
P();
dp[0] = 1;
sum[0] = 1;
in[0] = 1;
for (int i = 1; i <= n; i++) {
dp[i] = mul(sub(sum[i - 1], i - k - 1 >= 0 ? sum[i - k - 1] : 0), fac[i - 1]);
sum[i] = add(sum[i - 1], mul(dp[i], inv[i]));
}
cout << dp[n] << '\n';
return 0;
}