bzoj2032 [国家集训队]密码系统

ssl_cxy

已于 2022-07-20 15:43:28 修改

阅读量242

点赞数

分类专栏： DP # 倍增\矩阵优化DP 文章标签：动态规划算法

于 2022-07-13 22:33:46 首次发布

本文链接：https://blog.csdn.net/weixin_45523071/article/details/125772797

版权

DP 同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

倍增\矩阵优化DP

1 篇文章 0 订阅

订阅专栏

本文探讨了一道关于大进制数周期性的编程题，通过数论优化、矩阵快速幂到递推策略的转变，解决了在大范围数据下高效计算满足特定模条件的数的个数问题。作者详细介绍了从矩阵优化的困境，到利用子集容斥和多步递推的精妙优化过程。

摘要由CSDN通过智能技术生成

题目链接

题意

对于所有的 $N$ 位 $B$ 进制数 $φ$ ，按照各数位构成的集合分类，求每一类各有多少个数满足 $(\!\!\!\!\mod M)$ ，答案对 $1000$ 。
数据范围：
对于 $60\%$ 的数据， $B\leqslant 3$ ， $M\leqslant 120$ ；
对于另外 $40\%$ 的数据， $B\leqslant 10$ ， $M\leqslant 40$ ；
对于 $100\%$ 的数据， $N\leqslant 10^9$ ， $V\leqslant M$ 。

解析

看见 $N\leqslant 10^9$ ，果断考虑数论或者矩阵快速幂优化DP，考虑到每个数位直接联系不大，应该为矩阵快速幂。
设 $f_{i,j,S}$ 表示递推到第 $i$ 位，余数为 $j$ ，使用的数位状态为 $S$ 时的方案数，如 $f_{2,1,(101)_2}$ 表示递推到了第 $2$ 位，余数为 $1$ ，使用了 $0$ 和 $2$ 两个数字的方案数。
设下一位填入的数为 $d(0\leqslant d<b)$ ，可得：
$f_{i,j,S}=\sum\limits_{bk+d≡j (\!\!\!\!\mod M),S'\cup \{j\}=S} f_{i-1,k,S'}$
对 $i$ 进行优化，建立一个大小为 $M2^B$ 的矩阵加速递推，时间复杂度为 $O(8^BM^3logN)$ ，无法通过。
时间复杂度的瓶颈在于过于巨大的矩阵大小，可以看到这个 $2^B$ 过于恶臭，考虑优化它。

对于一个状态 $S$ ，可以发现它要求每个数位至少存在一次，所以占据了巨大的空间。
如果改为求出一个状态 $S$ 的所有子集，那么方程中的 $S^{'}$ 就会等于 $S$ ，我们就可以省下这一大部分的矩阵大小。
具体的，从小到大枚举 $S$ ，设 $f_{i,j}$ 表示递推到 $i$ 为，余数为 $j$ 时的方案数。可得：
$f_{i,j}=\sum\limits_{bk+d≡j (\!\!\!\!\mod M)} f_{i-1,k}$
目标状态为 $f_{n-1,V}$ ，最后不可以填 $0$ ，需特殊考虑。
对于每个 $S$ 具体的状态，直接枚举子集容斥掉即可求出。
时间复杂度为 $O(2^BM^3logN+3^B)$ ，还是不太行。

既然矩阵行不通，那就不使用矩阵，用另外的方式来进行递推。
观察之前的转移，每次一点一点的转移非常的缓慢，能不能多走几步呢？
可以。依然沿用先前 $f_{i,j}$ 的定义，可得递推：
$f_{i,j}=\sum\limits_{j_1b^{i_2}+j_2≡j (\!\!\!\!\mod M)}f_{i_1,j_1}f_{i_2,j_2}$
其中 $i_1+i_2=i$ ，不做硬性要求。
那么可以沿用快速幂的思想，用多个 $f_{2^i,x}$ 来拼凑出 $f_{n-1,V}$ 。
那么一次合并的时间复杂度为 $O(M^2)$ ，总时间复杂度即为 $O(2^BM^2logN+3^B)$ ，可以通过。

Code

#include<bits/stdc++.h>
#define mod 10007
using namespace std;
int n,b,m,V;
int dp[130],t[130],_dp[130],_ans[1024],ans[1024];
int main()
{
	cin>>n>>b>>m>>V;
	n--;
	for(int i=1;i<(1<<b);i++)
	{
		memset(t,0,sizeof t);
		memset(dp,0,sizeof dp);
		for(int j=0;j<b;j++)
			if(i&(1<<j))
			{
				t[j%m]++;
				if(j!=0)dp[j%m]++;
			}
		for(int j=n,x=b%m;j;j>>=1,x=(x*x)%m)
		{
			if(j&1)
			{
				memset(_dp,0,sizeof _dp);
				for(int u=0;u<m;u++)
					for(int v=0;v<m;v++)
						_dp[(u*x+v)%m]=(_dp[(u*x+v)%m]+dp[u]*t[v])%mod;
				memcpy(dp,_dp,sizeof _dp);
			}
			memset(_dp,0,sizeof _dp);
			for(int u=0;u<m;u++)
				for(int v=0;v<m;v++)
					_dp[(u*x+v)%m]=(_dp[(u*x+v)%m]+t[u]*t[v])%mod;
			memcpy(t,_dp,sizeof _dp);
		}
		ans[i]=dp[V];
		for(int j=i&(i-1);j;j=(j-1)&i)
			ans[i]=(ans[i]-ans[j]+mod)%mod;
		for(int j=b-1;j>=0;j--)
			if(i&(1<<j))cout<<j;
		cout<<' '<<ans[i]<<'\n';
	}
}