快速数论变换

linjiayang2016

已于 2023-03-04 21:07:34 修改

阅读量1.2k

点赞数 4

分类专栏：快速数论变换文章标签：快速数论变换

于 2019-07-10 16:32:37 首次发布

本文链接：https://blog.csdn.net/linjiayang2016/article/details/95349208

版权

快速数论变换专栏收录该内容

6 篇文章 0 订阅

订阅专栏

分类

缩写	全称	作用	时间复杂度
DFT	离散傅立叶变换	时频域转换	$O(n^2)$
FFT	快速傅立叶变换	时频域转换 $($ 有精度误差 $)$	$O(大常数+nlog_2n)$
NTT/FNTT	快速数论变换	模意义下的时频域转换	$O(小常数+nlog_2n)$
MTT	任意模数的NTT	任意模意义下的时频域转换	$O(nlog_2n)$
FWT	快速沃尔什变换	快速集合卷积	$O (不定)$
FMT	快速莫比乌斯变换	逆莫比乌斯反演？	$O (不定)$

快速数论变换(坑)

前置技能

　　本文不包含但必不可少的前置技能：

快速傅里叶变换
基础数论(互质，同余运算，欧拉定理，欧拉函数)

　　由于 FFT 涉及到复数运算，难免有精度问题，而且有的时候精度还不小，这便让我们考虑是否有在模意义下快速计算的方法，这就是快速数论变换
$(\text{Fast Number-Theoretic Transform,FNT})$ 　　理解FFT后，可以发现，FFT用的是单位根的五大性质。

$\omega_n^0=\omega_n^n=1$
$\forall\ i\ne j,\omega_n^i\ne \omega_n^j$ (用于还原系数)
$\omega^{2k}_{2n}=\omega^k_n$
$\omega_n^{k+\frac{n}{2}}=-\omega_n^k$
$\begin{aligned}\sum\limits_{i=0}^{n-1}(\omega_n^{j-k})^i =\begin{cases}0,k\ne j\\n,k=j\\\end{cases}\end{aligned}$ (用于逆FFT)

原根

(数论)阶　对于 $(a, n) = 1$ 的整数，满足 $a^r≡1 \pmod n$ 的最小整数 $r$ ，称为 $a$ 模 $n$ 的 (数论)阶。
原根　对于正整数 $n$ ，整数 $a$ ，若 $a$ 模 $n$ 的阶 $r$ 等于 $φ (n)$ ，则称 $a$ 为模 $n$ 的一个原根。

　　感性地理解一下，一个整数 $n$ 的数论阶为其最小开始循环的次方数（且与 $n$ 互质）。若一个正整数 $a$ 模 $p$ 的数论阶恰好为 $\varphi(n)$ ，则 $a$ 为 $p$ 的原根。

正题

　　根据原根的定义可得，对于质数 $p$ ，假如 $g$ 是 $p$ 的原根，则 $g^0≡g^{\varphi(p)}≡1\pmod p$ ，进一步可以得到，对于任意 $a\not≡ b\pmod {\varphi(p)}$ ，有 $g^a\not ≡g^b\pmod p$ 。

　　对于质数 $p=k\cdot2^N+1$ ，设其原根为 $g$ 。我们令 ${g_n≡g^{\frac{p-1}{n}}\pmod p}$ 。注意，这里的 $g_n$ 是定义出来的，只是在数值上等于 $g^{\frac {p-1}{n}}$ ，与 $g$ 没有关系。容易发现，这样的定义使得 $g_n$ 满足了第一条、第二条和第三条性质。

性质1证明：
　　由于 ${g^n_n≡\Big(g^{^{p-1\over n}}\Big)^n≡g^{p-1}≡1≡g_n^0\pmod p}$ 　　因此其满足性质1。

性质2证明：
　　由于 $p\in \text{prime}$ ，因而 $\varphi(p)=p-1$ ，因此对于所有 ${a\not≡ b\pmod {(p-1)}}$ ，有 ${g^a\not≡ g^b\pmod p}$ 。
　　因此对于所有 ${a\not≡ b\pmod {(p-1)}}$ ，有 ${g_n^a≡(g^{\frac{p-1}{n}})^a\not≡ (g^{\frac{p-1}{n}})^b≡g_n^b\pmod p}$ 　　因此其满足性质2。

性质3证明：
　　由于 ${g^{2k}_{2n}≡(g^{p-1\over 2n})^{2k}≡(g^{p-1\over n})^{k}}≡g_n^k\pmod p$ 　　因此其满足性质3。

性质4证明：
　　由于 $p$ 是质数，并且 ${g_n^n \equiv 1 \pmod p}$ ，因而有
${g^{\frac n2}_n≡1\pmod p}\quad \text{or}\quad {g^{\frac n2}_n≡-1\pmod p}$ 　　由第二条性质可得 ${g^{\frac n2}_n\not≡ g_n^{n} ≡1\pmod p}$ ，因而舍去前者，取后者，因而有 $g_n^{k+\frac n2}≡g_n^k\cdot g_n^{\frac n2}=-g_n^k\pmod p$ 　　因此其满足性质4。

性质5证明：
　　当 $k\ne j$ 时，根据等比数列的求和公式，可得：
$\begin{aligned}\sum_{i=0}^{n-1}(g_n^{j-k})^i =&\dfrac{(g_n^k)^{n}-1}{g_n^k-1}\\ =&\dfrac{(g_n^n)^{k}-1}{g_n^k-1}\\ =&\dfrac{1-1}{g_n^k-1}\\ =&\ 0\\ \end{aligned}$

　　当 $k = j$ 时，可得 $\begin{aligned}\sum\limits_{i=0}^{n-1}(g_n^{j-k})^i =\sum\limits_{i=0}^{n-1}\ 1=n\end{aligned}$
　　综上，有 $\begin{aligned}\sum\limits_{i=0}^{n-1}(g_n^{j-k})^i =\begin{cases}0,k\ne j\\n,k=j\\\end{cases}\end{aligned}$

　　至此，我们发现 $g_n$ 满足 $w_n$ 的五条性质，因而我们可以大方地用 $g_n$ 代替 $w_n$ 。

细节

　　为什么模数必须取 $k\cdot2^N+1$ ？注意到我们取 ${g_n≡g^{\frac{p-1}{n}}\pmod p}$ ，因而 $\dfrac {p-1}{n}$ 必须是整数。考虑到之前FFT的过程是不断地二分，因而我们可以保证 $n$ 总是 $2$ 的倍数，因而模数必须有足够多的质因子 $2$ ，因而取 $k\cdot2^N+1$ ，且 $N$ 必须足够大。

　　但这也注定了FNT的一个弊端，对于如果 $r⋅2^N+1$ 是个素数，那么在模 $k⋅2^N+1$ 意义下，只可以处理 $2^N$ 以内规模的数据。对于一些好的质数及其原根见这里。

　　在逆 $FNT$ 的时候，我们需要求 $g_n^{-1}$ ，在模意义下，也就是 $g_n$ 的逆元，预处理即可。

代码

$\text{Accepted -O2}$ / 用时: $1925 m s$ / 内存: $243752\text{KB}$

#include<bits/stdc++.h>
using namespace std;
#define LL long long
const int maxn=3*1e6+10,P=998244353,G=3,inv_G=332748118;
int N,M,limit,L,r[maxn];
LL a[maxn],b[maxn];
inline LL fastpow(LL a,LL k) {
    LL base=1;
    while(k) {
        if(k&1) base=(base*a)%P;
        a=(a*a)%P;
        k>>=1;
    } return base%P;
}
#define inv(x) fastpow(x,P-2)
inline void NTT(LL *A,int type) {
    for(int i=0;i<limit;i++)
        if(i<r[i]) swap(A[i],A[r[i]]);
    for(int mid=1;mid<limit; mid <<= 1) {
        LL Wn=fastpow(type==1?G:inv_G,(P-1)/(mid<<1));
        for(int j=0;j<limit;j+=(mid<<1)) {
            LL w=1;
            for(int k=0;k<mid;k++,w=(w*Wn)%P) {
                int x=A[j+k],y=w*A[j+k+mid]%P;
                A[j+k]=(x+y)%P,
                A[j+k+mid]=(x-y+P)%P;
            }
        }
    }
}
int main() {
    scanf("%d%d",&N,&M);
    for(int i=0;i<=N;i++)
        scanf("%d",&a[i]),a[i]=(a[i]+P)%P;
    for(int i=0;i<=M;i++)
        scanf("%d",&b[i]),b[i]=(b[i]+P)%P;
    for(limit=1,L=0;limit<=N+M;limit<<=1,L++);
    for(int i=0;i<limit;i++)
        r[i]=(r[i>>1]>>1)|((i&1)<<(L-1));
    NTT(a,1);NTT(b,1);
    for(int i=0;i<limit;i++)
        a[i]=(a[i]*b[i])%P;
    NTT(a,-1);
    LL inv=inv(limit);
    for(int i=0;i<=N+M;i++)
        printf("%d ",(a[i]*inv)%P);
    return 0;
}

可以发现，FNT和FFT的效率差别还是很大的，FNT完美碾压FFT。

任意模数

　　FNT虽快，但使用局限太多，当模数不为 $k⋅2^N+1$ 时，FNT便无法发挥其效果，有没有解决办法呢？当然有。（坑）

linjiayang2016

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
快速数论变换

由于 FFT 涉及到复数运算，难免有精度问题，而且有的时候精度还不小，这便让我们考虑是否有在模意义下快速计算的方法，这就是快速数论变换。考虑到之前FFT的过程是不断地二分，因而我们可以保证。可以发现，FNT和FFT的效率差别还是很大的，FNT完美碾压FFT。理解FFT后，可以发现，FFT用的是单位根的五大性质。但这也注定了FNT的一个弊端，对于如果。FNT虽快，但使用局限太多，当模数不为。的倍数，因而模数必须有足够多的质因子。，因而舍去前者，取后者，因而有。，进一步可以得到，对于任意。
复制链接

扫一扫

专栏目录