多项式学习笔记

zcxxn

已于 2024-03-03 08:57:23 修改

阅读量303

点赞数 3

分类专栏：算法文章标签：学习

于 2023-01-10 20:21:06 首次发布

本文链接：https://blog.csdn.net/zcxxn/article/details/128613956

版权

算法专栏收录该内容

14 篇文章 1 订阅

订阅专栏

记录多项式以及一些相关数论前置芝士qwq

拉格朗日插值

由 $n$ 个点 $x_i,y_i)$ 可以唯一确定一个 $n - 1$ 次多项式 $f (x)$ ，要求出 $f (k)$ 的值可以 $O(n^3)$ 高斯消元，而拉格朗日插值可以做到 $O(n^2)$ 求解。

由 $f(x)=a_0+a_1x+a_2x^2+\cdots +a_nx^n$ ， $f(k)=a_0+a_1k+a_2k^2+\cdots+a_nk^n$ 得 $f(x)-f(k)=a_1(x-k)+a_2(x^2-k^2)+\cdots+a_n(x^n-k^n)\equiv0\pmod{x-k}$ ，则 $f(x)\equiv f(k)\pmod{x-k}$ 。

把 $n$ 个点都带入方程，可得同余方程组 $f(k)\equiv y_i\pmod{k-x_i})\ (1\le i\le n)$

套用 CRT 的求解，令 $M=\prod\limits_{i=1}^n(k-x_i),m_i=\dfrac{M}{k-x_i}$ ，则有：
$f(k)=\sum\limits_{i=1}^ny_i\times m_i\times m_i^{-1}$
$\quad\quad\ =\sum\limits_{i=1}^ny_i\times\prod\limits_{j\ne i}(k-x_j)\times m_i^{-1}$
$\quad\quad\ =\sum\limits_{i=1}^ny_i\times\prod\limits_{j\ne i}(k-x_i+x_i-x_j)\times \prod\limits_{j\ne i}\dfrac{1}{x_i-x_j}$
$\quad\quad\ =\sum\limits_{i=1}^ny_i\times\prod\limits_{j\ne i}\dfrac{k-x_j}{x_i-x_j}$

中间在 $k-x_i$ 剩余系中转化了一下逆元，最后求出的就是拉格朗日插值的式子，在模意义和非模意义下通用。

$x_i$ 是连续整数的插值

对于 $\forall_{i=1}^n x_i=i$ ，可以将拉格朗日插值的式子进一步简化：

$\begin{cases}\prod\limits_{j\ne i}(i-j)=(-1)^{n-i}(i-1)!\ (n-i)!\\\prod\limits_{j\ne i}(k-j)=\dfrac{\prod\limits_{j=1}^n (k-j)}{k-i}\end{cases}$
$\implies f(k)=\sum\limits_{i=1}^n y_i\times (-1)^{n-i}\ \dfrac{\prod\limits_{j=1}^n (k-j)}{(i-1)!\ (n-i)!(k-i)}$

分子的和分母都可以预处理，于是可以做到 $O (n)$ 。

~~永远记不住的~~线性求逆元柿子： $inv[i]=(p-p/i)\times inv[p\%i]$

重心拉格朗日插值

当需要新加入一个点的时候，用朴素的拉插式子算是 $O(n^2)$ 的，但可以推柿子做到 $O (n)$ ：

$f(k)=\sum\limits_{i=1}^ny_i\times\prod\limits_{j\ne i}\dfrac{k-x_j}{x_i-x_j}$
$\quad\quad\ =\sum\limits_{i=1}^ny_i\times\dfrac{\prod\limits_{j=1}^nk-x_j}{(k-x_i)\prod\limits_{j\ne i}(x_i-x_j)}$
$\quad\quad\ =\prod\limits_{i=1}^n(k-x_i)\sum\limits_{i=1}^n\dfrac{y_i}{(k-x_i)\prod\limits_{j\ne i}(x_i-x_j)}$

设 $g(k)=\prod\limits_{i=1}^n(k-x_i)$ ， $t_i=\prod\limits_{j\ne i}\dfrac{1}{x_i-x_j}$ ，则 $f(k)=g(k)\sum\limits_{i=1}^n\dfrac{y_it_i}{k-x_i}$ ，每次新增一个点 $n$ 可以 $O (1)$ 更新 $g (k)$ ， $O (n)$ 求 $t_n$ ， $O (n)$ 更新 $t_1$ 到 $t_{n-1}$ ，再 $O (n)$ 更新 $f (k)$ ，这个点就插入成功了。

快速傅里叶变换

前置芝士：

多项式的系数表示法：即常见的函数形式，形如 $f(x)=a_0+a_1x+a_2x^2+\cdots +a_nx^n$ ；
多项式的点值表示法：对于一个 $n - 1$ 次多项式， $n$ 个不同的 $x$ 代入能得到 $n$ 个不同的点 $x_i,y_i)$ ，这 $n$ 个点唯一确定了该多项式；
多项式的系数表示和点值表示可以相互转化。

快速傅里叶变换（FFT）就是一种 $O(n\log n)$ 将系数表示转化为点值表示，进而求出两个多项式的乘积的方法。

离散傅里叶变换

傅里叶把多项式先填到最高次项（系数可以为 $0$ ）为 $n=2^k$ 的形式，然后规定点值表示中的点为 $n$ 个模长为 $1$ 的复数，使得这些复数在平面直角坐标系中把单位圆 $n$ 等分。

为了方便，将这些点以 $(1, 0)$ 为起点逆时针编号为 $0$ 到 $n - 1$ ，第 $k$ 个点的坐标为 $(\cos\frac{k}{n}2π,\sin\frac{k}{n}2π)$ ，表示的复数为 $w_n^k$ ，其中 $w_n^1$ 叫作 $n$ 次单位根。

这种点值选取的方式就是离散傅里叶变换（DFT）。

根据复数和三角函数的一些知识，得到（设 $a$ 为常数）：

$w_n^k=w_{an}^{ak}$
$w_n^k=-w_{n}^{k+\frac{n}{2}}$
$w_n^k=w_n^{k+an}$

快速傅里叶变换

在 DFT 的基础上，我们推一些柿子：将 $f(x)=a_0+a_1x+a_2x^2+\cdots +a_nx^{n-1}$ 按 $x$ 的幂次的奇偶拆开并化简：

$f(x)=(a_0+a_2x^2+\cdots+a_{n-2}x^{n-2})+(a_1x+a_3x^3+\cdots+a_{n-1}x^{n-1})$
$\quad\quad\ =(a_0+a_2(x^1)^2+\cdots+a_{n-2}(x^{\frac{n-2}{2}})^2)+x(a_1+a_3(x^1)^2+\cdots a_{n-2}(x^{\frac{n-2}{2}})^2)$

令 $g(x)=a_0+a_2x+\cdots+a_{n-2}x^{\frac{n-2}{2}}$ ， $h(x)=a_1+a_3x+\cdots+a_{n-1}x^{\frac{n-2}{2}}$ ，则 $f(x)=g(x^2)+x\ h(x^2)$ 。

把 DFT 中选择的点代入：

$k<\dfrac{n}{2}$ ， $f(w_n^k)=g(w_n^{2k})+w_n^k\ h(w_n^{2k})=g(w_\frac{n}{2}^k)+w_n^k\ h(w_\frac{n}{2}^k)$
$k\ge \dfrac{n}{2}$ ， $f(w_n^k)=g(w_n^{2k+n})+w_n^{k+\frac{n}{2}}h(w_n^{2k+n})=g(w_\frac{n}{2}^k)-w_n^kh(w_\frac{n}{2}^k)$

那么这就是分治了，但是由于大常数选手的递归版跑得过慢等原因，代码就不放了/kk

递归本身常数就是比较大的，考虑能不能优化。模拟一下每次选奇偶点分前后两半的过程，发现如果把 $i$ 的二进制表示前后翻转所得的数为 $j$ ，那么递归后原本在位置 $i$ 的数会跑到位置 $j$ ，这就是位逆序变换。因此可以预处理出每个数的最终位置，一点点向上合并即可。

实现的时候，~~复数可以用 STL 的 complex~~，复数建议手写因为 complex 常数很大，预处理 $i$ 翻转二进制位所得的数 $pos_i$ ，就可以写出 FFT 了：

inline void fft(com *a,com *omg){
	ff(i,0,n-1) if(pos[i]<i) swap(a[pos[i]],a[i]);
	for(int len=2;len<=n;len<<=1){
		int m=len>>1;
		for(int i=0;i<n;i+=len) ff(j,0,m-1){
			com tmp=a[i+j+m]*omg[n/len*j];
			a[i+j+m]=a[i+j]-tmp,a[i+j]+=tmp;
		}	
	}
}

离散傅里叶逆变换

我们用 FFT 成功加速了系数表示转点值表示的过程，但目的是想加速多项式乘法。FFT 是 $O(n\log n)$ 的，两个点值表示的多项式相乘是 $O (n)$ 的，想求乘法我们还需要快速将点值表示转化为系数表示，就需要离散傅里叶逆变换（IDFT）。

假设我们对 $f (x)$ 进行 DFT之后得到了一系列纵坐标 $(y_0,y_1,\cdots,y_{n-1})$ ，构造函数 $g(x)=y_0+y_1x+\cdots+y_{n-1}x^{n-1}$ ，把 $w_n^0,w_n^{-1},\cdots,w_n^{-(n-1)}$ 代入得到 $(z_0,z_1,\cdots,z_{n-1})$ ：

$z_k=\sum\limits_{i=0}^{n-1}y_i\times(w_n^{-k})^i$
$\quad\ =\sum\limits_{i=0}^{n-1}\sum\limits_{j=0}^{n-1}a_j\times (w_n^i)^j\times(w_n^{-k})^i$
$\quad\ =\sum\limits_{j=0}^{n-1} a_j\sum\limits_{i=0}^{n-1}(w_n^{j-k})^i$
而 $\sum\limits_{i=0}^{n-1}(w_n^{j-k})^i=\begin{cases}j=k\quad n\\j\ne k\quad \dfrac{(w_n^{j-k})^n-1}{w_n^{j-k}-1}=0\end{cases}$

故当且仅当 $j = k$ ， $z_k=a_j\times n$ 。

所以对 $g (x)$ 代入 $w_n^0,w_n^{-1},\cdots,w_n^{-(n-1)}$ 之后求 DFT 的结果除以 $n$ 就可以得到 $f (x)$ 的各项系数，而形如 $w_n^{-1}$ 的就是共轭复数。

学了一大顿之后就又可以写高精乘法了：（亲测不预处理 $w_n^k$ 会更快）

#include<bits/stdc++.h>
#define ll long long
#define rep(i,s,e) for(int i=(s);i<=(e);++i)
#define Rep(i,s,e) for(int i=(e);i>=(s);--i)
using namespace std;
inline int read(){
    int x=0,f=1;
    char ch=getchar();
    while(ch>'9'||ch<'0'){if(ch=='-') f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){x=(x<<1)+(x<<3)+(ch^48);ch=getchar();}
    return x*f;
}
const int N=1<<21;
const double pai=acos(-1);
int n1,n2,n=1,m,pos[N],ans[N];
char s1[N],s2[N];
struct qwq{
    double x,y;
}a[N],b[N];
inline qwq operator + (const qwq &a,const qwq &b){
    return {a.x+b.x,a.y+b.y};
}
inline qwq operator - (const qwq &a,const qwq &b){
    return {a.x-b.x,a.y-b.y};
}
inline qwq operator * (const qwq &a,const qwq &b){
    return {a.x*b.x-a.y*b.y,a.x*b.y+b.x*a.y};
}
inline void fft(qwq a[],int flag){
    rep(i,0,n-1) if(pos[i]<i) swap(a[pos[i]],a[i]);
    for(int len=2;len<=n;len<<=1){
        int m=len>>1;
        qwq x={cos(2*pai/len),flag*sin(2*pai/len)};
        for(int i=0;i<n;i+=len){
            qwq now={1,0};
            rep(j,0,m-1){
                qwq tmp=a[i+j+m]*now;
                a[i+j+m]=a[i+j]-tmp,a[i+j]=a[i+j]+tmp;
                now=now*x;
            }
        }
    }
}
signed main(){
    scanf("%s",s1),n1=strlen(s1);
    scanf("%s",s2),n2=strlen(s2);
    rep(i,0,n1-1) a[i].x=s1[n1-i-1]-'0';
    rep(i,0,n2-1) b[i].x=s2[n2-i-1]-'0';
    while(n<n1+n2) n<<=1,++m;
    rep(i,0,n-1){
        int tmp=0;
        rep(j,0,m-1) if(i&(1<<j)) tmp|=(1<<m-j-1);
        pos[i]=tmp;
    }
    fft(a,1),fft(b,1);
    rep(i,0,n-1) a[i]=a[i]*b[i];
    fft(a,-1);
    rep(i,0,n-1){
        ans[i]+=floor(a[i].x/n+0.5);
        if(ans[i]>=10) ans[i+1]+=ans[i]/10,ans[i]%=10;
    }
    while(n>1&&ans[n-1]==0) --n;
    Rep(i,0,n-1) putchar(ans[i]+'0');
    putchar('\n');
}

快速数论变换

感觉 OI Wiki 上原根之外的前置知识都可以直接背下来？

原根

阶：使得 $a^n\equiv1\pmod{m}$ 成立的最小正整数 $n$ 叫做 $a$ 模 $m$ 的阶，符号 $\delta_m(a)$ 。

一些性质：

$\forall a^n\equiv 1\pmod{m},\delta_m(a)\mid n\implies\delta_m(a)\mid\phi(m)$
$\forall_{i,j\in[1,\delta_m(a)],i\ne j}\ a^i\not\equiv a^j\pmod{m}$
$\gcd(a,m)=1,\delta_m(a^k)=\dfrac{\delta_m(a)}{\gcd(k,\delta_m(a))}$

原根：若 $\gcd(a,m)=1,\delta_m(a)=\phi(m)$ ，则 $a$ 是 $m$ 的原根。

判定定理： $\forall_{p\mid \phi(m)} a^{\frac{\phi(m)}{p}}\not\equiv1\pmod{m}\iff a$ 是 $m$ 的原根；
存在定理：只有 $2,4,p^a,2p^a$ 才存在原根，其中 $p$ 为奇素数；
原根个数：若 $m$ 有原根，则其原根个数为 $\phi(\phi(m))$ ；
$m$ 的最小原根 $g$ 不超过 $m^{\frac{1}{4}}$ ，所有其它原根均为 $g^k\ (\gcd(k,\phi(m)=1))$ 。

快速数论变换

FFT 的缺点在于浮点数运算会产生精度问题，实际上在模数是一些特定质数 $p=k\times 2^n+1$ 时可以将单位根替换为原根进行计算。这些质数被称为 NTT 模数，常见的是 $998244353$ ，原根为 $g = 3$ 。

根据原根的性质可知 $g^{kn}\equiv 1\pmod p$ 且 $i\in[0,p)$ 范围内 $g_i\bmod p$ 两两不同，于是单位根满足的性质原根全部满足，就可以类似 FFT 来求解，IDFT 的求共轭复数变为求逆元即可。

模板代码：

#include<bits/stdc++.h>
#define ll long long
#define rep(i,s,e) for(int i=(s);i<=(e);++i)
#define Rep(i,s,e) for(int i=(e);i>=(s);--i)
using namespace std;
inline int read(){
	int x=0,f=1;
	char ch=getchar();
	while(ch>'9'||ch<'0'){if(ch=='-') f=-1;ch=getchar();}
	while(ch>='0'&&ch<='9'){x=(x<<1)+(x<<3)+(ch^48);ch=getchar();}
	return x*f;
}
const int N=3e6+5,mod=998244353;
int n1,n2,m,n=1,p[N];
ll a[N],b[N];
inline ll ksm(ll x,int y){
    ll res=1;
    for(;y;y>>=1){
        if(y&1) res=res*x%mod;
        x=x*x%mod;
    }
    return res;
}
inline void NTT(ll a[],int flag){
    rep(i,0,n-1) if(p[i]<i) swap(a[i],a[p[i]]);
    for(int len=2;len<=n;len<<=1){
        int m=len>>1;ll x=ksm(3,(mod-1)/len);
        if(flag==-1) x=ksm(x,mod-2);
        for(int i=0;i<n;i+=len){
            ll now=1;
            rep(j,0,m-1){
                ll u=a[i+j],v=a[i+j+m]*now%mod;
                a[i+j]=(u+v)%mod,a[i+j+m]=(u-v+mod)%mod;
                now=now*x%mod;
            }
        }
    }
    if(flag==-1){
        int inv=ksm(n,mod-2);
        rep(i,0,n-1) a[i]=a[i]*inv%mod;
    }
}
signed main(){
    n1=read(),n2=read();
    rep(i,0,n1) a[i]=read();
    rep(i,0,n2) b[i]=read();
    while(n<(n1+n2+2)) n<<=1,++m;
    rep(i,1,n){
        int now=0;
        rep(j,0,m-1) if(i&(1<<j)) now|=(1<<m-j-1);
        p[i]=now;
    }
    NTT(a,1),NTT(b,1);
    rep(i,0,n-1) a[i]=a[i]*b[i]%mod;
    NTT(a,-1);
    rep(i,0,n1+n2) printf("%lld ",a[i]);
    putchar('\n');
}

快速莫比乌斯变换 & 快速沃尔什变换

感谢可爱的猫告诉我基于分治的 and 和 or 卷积叫 FWT，基于 dp 卷积的叫 FMT。好强大的樱雪喵。

与卷积、或卷积和异或卷积的本质都是仿照 FFT 将多项式 $A, B$ 转化为点值表示 $F W T [A], F W T [B]$ ，根据 $FWT[C]=FWT[A]\times FWT[B]$ 得到 $F W T [C]$ ，再逆运算得到多项式 $C$ （以下称逆运算为 $U F W T [A]$ ）

OR 卷积

要求 $c_k=\sum\limits_{i|j=k} a_ib_j$ ，考虑根据 $i|k=k,j|k=k\iff (i|j)|k=k$ ，设 $FWT[A]_k=\sum\limits_{i|k=k}a_i$ 。

考虑分治，把长为 $2^n$ 的数组写成分成前后两段，前一段二进制最高位全为 $0$ ，后一段全为 $1$ ，更低位前后两段的情况是一样的。把这两段分别记为 $A 0$ 和 $A 1$ ，则 $A 1$ 的子集也包括最高位为 $0$ 的子集，即：
$FWT[A]=merge(FWT[A0],FWT[A0]+FWT[A1])\\UFWT[A]=merge(UFWT[A0],UFWT[A1]-UFWT[A0])$

AND 卷积

要求 $c_k=\sum\limits_{i\&j=k} a_ib_j$ ，考虑根据 $i\&k=k,j\&k=k\iff (i\&j)\&k=k$ ，设 $FWT[A]=\sum\limits_{i\&k=k}a_i$ 。

同理 OR 卷积可知
$FWT[A]=merge(FWT[A0]+FWT[A1],FWT[A0])\\UFWT[A]=merge(UFWT[A0]-UFWT[A1],UFWT[A1])$

XOR 卷积

要求 $c_k=\sum\limits_{i\operatorname{xor}j=k}a_ib_j$ ，设 $d (x)$ 为 $x$ 二进制下 $1$ 个数的奇偶性，根据 $d(i\&k)\operatorname{xor}d(j\&k)=d((i\operatorname{xor}j)\&k)$ ，设 $FWT[A]=\sum\limits_i(-1)^{d(i\&k)}a_i$ 。

由于只有 $1\&1=1$ ，会使得 $d ()$ 的奇偶性改变，所以可得：
$FWT[A]=merge(FWT[A0]+FWT[A1],FWT[A0]-FWT[A1])\\UFWT[A]=merge(\dfrac{UFWT[A0]+UFWT[A1]}{2},\dfrac{UFWT[A0]-UFWT[A1]}{2})$

于是就可以在 $O(n\log n)$ 的复杂度内分别求出三个卷积。

#include<bits/stdc++.h>
#define ll long long
#define rep(i,s,e) for(int i=(s);i<=(e);++i)
#define Rep(i,s,e) for(int i=(e);i>=(s);--i)
using namespace std;
inline int read(){
    int x=0,f=1;
    char ch=getchar();
    while(ch>'9'||ch<'0'){if(ch=='-') f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){x=(x<<1)+(x<<3)+(ch^48);ch=getchar();}
    return x*f;
}
const int N=(1<<17)+5,mod=998244353;
int n;
ll a[N],b[N],c[N],x[N],y[N],inv;
inline ll ksm(ll x,int y){
    ll res=1;
    for(;y;y>>=1){
        if(y&1) res=res*x%mod;
        x=x*x%mod;
    }
    return res;
}
inline void OR(ll a[],int flag){
    for(int len=2;len<=n;len<<=1){
        int m=len>>1;
        for(int i=0;i<n;i+=len) rep(j,0,m-1){
            int u=a[i+j],v=a[i+j+m];
            a[i+j+m]=flag==1?(u+v)%mod:(v-u+mod)%mod;
        }
    }
}
inline void AND(ll a[],int flag){
    for(int len=2;len<=n;len<<=1){
        int m=len>>1;
        for(int i=0;i<n;i+=len) rep(j,0,m-1){
            int u=a[i+j],v=a[i+j+m];
            a[i+j]=flag==1?(u+v)%mod:(u-v+mod)%mod;
        }
    }
}
inline void XOR(ll a[],int flag){
    for(int len=2;len<=n;len<<=1){
        int m=len>>1;
        for(int i=0;i<n;i+=len) rep(j,0,m-1){
            int u=a[i+j],v=a[i+j+m];
            a[i+j]=flag==1?(u+v)%mod:(u+v)%mod*inv%mod;
            a[i+j+m]=flag==1?(u-v+mod)%mod:(u-v+mod)%mod*inv%mod;
        }
    }
}
signed main(){
    n=1<<read(),inv=ksm(2,mod-2);
    rep(i,0,n-1) a[i]=x[i]=read();
    rep(i,0,n-1) b[i]=y[i]=read();
    OR(a,1),OR(b,1);
    rep(i,0,n-1) c[i]=a[i]*b[i]%mod,a[i]=x[i],b[i]=y[i];
    OR(c,-1);
    rep(i,0,n-1) printf("%lld ",c[i]);putchar('\n');
    AND(a,1),AND(b,1);
    rep(i,0,n-1) c[i]=a[i]*b[i]%mod,a[i]=x[i],b[i]=y[i];
    AND(c,-1);
    rep(i,0,n-1) printf("%lld ",c[i]);putchar('\n');
    XOR(a,1),XOR(b,1);
    rep(i,0,n-1) c[i]=a[i]*b[i]%mod;
    XOR(c,-1);
    rep(i,0,n-1) printf("%lld ",c[i]);putchar('\n');
}