bzoj1919: [Ctsc2010]性能优化

最新推荐文章于 2019-06-16 21:37:04 发布

lvzelong2014

最新推荐文章于 2019-06-16 21:37:04 发布

阅读量421

点赞数

分类专栏： # 数学相关

本文链接：https://blog.csdn.net/lvzelong2014/article/details/85939531

版权

数学相关专栏收录该内容

64 篇文章 0 订阅

订阅专栏

bzoj1919: [Ctsc2010]性能优化

在这里插入图片描述

权限题贴个题面。
luogu上也有。

分析

循环卷积裸题。
由于 $w_n^i= w_n^{i \mod n}$
所以说 $w_n^iw_n^j=w_n^{(i+j)\mod n}$
发现这刚好是循环卷积的形式。
所以说做长度为 $n$ 的 $D F T$ 之后再 $I D F T$ 就好了。
重点在于这题的 $n$ 的长度不是 $2^n$ ，模数也非常诡异。
所以要介绍Cooley–Tukey FFT algorithm
注意到模数比较小而且是质数，所以直接映射单位复根到模意义下的原根。
回忆快速数论变换的过程。
$e^{\frac{2\pi i}{n}}\equiv g^{\frac{P-1}{n}}$
这个时候我们不这么搞，直接
$e^{\frac{2\pi i}{n}}\equiv g$
带点值的时候直接把 $g^k$ 带进去就好了。
然后最关键的问题来了， $n$ 不是 $2^n$
但是题目给了一个条件 $n=2^{k_1}3^{k_2}5^{k_3}7^{k_4}$
$F F T$ 原本是即将序列分成两半，然后合并。
现在就吧序列分成 $k = 2, 3, 5, 7$ 块，然后合并。
比较麻烦的事情就来了——式子得重推。
对于一次分治，假设当前是分成 $p$ 块，当前总长度为 $L$ ，那么分治之后每块的大小就是 $d=\frac{L}{p}$ 。
$A(g^k)=a_0+a_1g^k+a_2g^{2k}\cdots a_{L-1}g^{k(L-1)}$
为了方便，接下来的式子中令 $X=g^k$
按照 $\mod p$ 的剩余系分类
$=(a_0+a_pX^p+\cdots a_{p(d-1)}X^{p(d-1))})+(a_1X^1+a_{p+1}X^{p+1}\cdots a_{p(d-1)+1}X^{p(d-1)+1})+\cdots +(a_{p-1}X^{p-1}+a_{p-1+d}X^{p-1+d}\cdots a_{pd-1}X^{pd-1})$
$=\sum_{0\le b< p}\sum_{0\le a<d}a_{ap+b}X^{ap+b}=\sum_{0\le b< p}X^b\sum_{0\le a<d}a_{ap+b}X^{ap}$
考虑分治往下一层，这个时候稍微注意一下下一层的点值用 $w=g^p$ 的次幂去带。
如果我们已经得到了分治之后的结果，也就是
$A_0(w^m)=a_0+a_pw^m+\cdots a_{p(d-1)}w^{m(d-1)}=\sum_{0\le a < d}a_{ap}w^{ma}$
$A_b(w^m)=\sum_{0\le a < d}a_{ap+b}w^{ma}$
$m\in[0,d)$
那么
$A(g^k)=\sum_{0\le b< p}g^{kb}\sum_{0\le a<d}a_{ap+b}g^{akp}=\sum_{0\le b< p}g^{kb}A_b(g^{kp})=\sum_{0\le b< p}g^{kb}A_b(w^k)$
一波推导，我们得到了一个式子。
$A(g^k)=\sum_{0\le b< p}g^{kb}A_b(w^k)$
美中不足的是 $k\in [0,L)$
这个时候令 $k = u d + v$
那么
$A(g^{ud+v})=\sum_{0\le b< p}g^{(ud+v)b}A_b(w^{(ud+v)})$
注意到 $w^d=g^{pd}=g^L=1$
于是就有
$A(g^{ud+v})=\sum_{0\le b< p}g^{(ud+v)b}A_b(w^{v})$
搞定！
果然还是太菜了，网上的大佬似乎都是直接秒出这个式子，只有蒟蒻用markdown推了半天。。。

代码

#include<bits/stdc++.h>
const int N = 5e5 + 10;
int ri() {
	char c = getchar(); int x = 0, f = 1; for(;c < '0' || c > '9'; c = getchar()) if(c == '-') f = -1;
	for(;c >= '0' && c <= '9'; c = getchar()) x = (x << 1) + (x << 3) - '0' + c; return x * f;
}
int a[N], b[N], w[N], R[N], pr[101], tot, P, G, n;
int add(int &a, int b) {return a += b, a >= P ? a - P : a;}
int mul(int a, int b) {return 1LL * a * b % P;}
int Pow(int x, int k) {
	int r = 1;
	for(;k; x = mul(x, x), k >>= 1)
		if(k & 1)
			r = mul(r, x);
	return r;
}
bool Ck(int x, int t) {
	for(int i = 1;i <= tot; ++i)
		if(Pow(x, t / pr[i]) == 1)
			return true;
	return false;
}
void Findori() {
	int x = P - 1;
	for(int i = 2;i <= 7; ++i)
		for(;!(x % i); pr[++tot] = i, x /= i) ;
	G = 2;
	for(;Ck(G, n);) ++G;
}
int Pos(int x, int s, int de, int len) {
	if(de == tot + 1) return s;
	int d = len / pr[de], r = x % pr[de];
	return Pos(x / pr[de], s + d * r, de + 1, d);
}
void DFT(int *A) {
	static int B[N];
	for(int i = 0;i < n; ++i)
		B[R[i]] = A[i];
	int *cur = B, *nxt = A;
	for(int d = 1, de = tot; de; d *= pr[de--], std::swap(cur, nxt)) {
		int pd = d * pr[de], p = n / pd; //w(n,m)^p=w(n/p,m)
		for(int st = 0; st < n; st += pd)
			for(int a = 0; a < pd; a += d) // a * d
				for(int b = 0;b < d; ++b) {
					int &ps = nxt[st + a + b], o = (a + b) * p; ps = 0;
					for(int r = 0; r < pr[de]; ++r)
						ps = add(ps, mul(w[1LL * o * r % n], cur[st + r * d + b]));
				}
	}
	if(cur != A)
		memcpy(A, cur, sizeof(int) * n);
}
int main() {
	n = ri(); int C = ri() % n; P = n + 1;
	Findori();
	for(int i = 0;i < n; ++i)
		a[i] = ri() % P;
	for(int i = 0;i < n; ++i)
		b[i] = ri() % P;
	w[0] = 1;
	for(int i = 1;i < n; ++i)
		w[i] = mul(w[i - 1], G);
	for(int i = 1;i < n; ++i)
		R[i] = Pos(i, 0, 1, n);
	DFT(a); DFT(b);
	for(int i = 0;i < n; ++i)
		a[i] = mul(a[i], Pow(b[i], C));
	DFT(a);
	std::reverse(a + 1, a + n);
	for(int i = 0;i < n; ++i)
		printf("%d\n", mul(a[i], n)); // n * n = 1 (mod n + 1)
	return 0;
}

lvzelong2014

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
bzoj1919: [Ctsc2010]性能优化

bzoj1919: [Ctsc2010]性能优化分析循环卷积裸题。由于wni=wnimod&amp;amp;amp;amp;ThinSpace;&amp;amp;amp;amp;ThinSpace;nw_n^i= w_n^{i \mod n}wni=wnimodn所以说wniwnj=wn(i+j)mod&amp;amp;amp;amp;ThinSpace;&amp;amp;amp;amp;ThinSpace;nw_n^iw_n^j=w_n^{(
复制链接

扫一扫