快速沃尔什变换（FWT）

dygxczn

于 2023-04-26 17:36:00 发布

阅读量662

点赞数 6

文章标签：算法

本文链接：https://blog.csdn.net/dygxczn/article/details/130350148

版权

FWT 是什么

FWT 是一个用来快速求出下标进行位运算卷积的方法。

FWT 怎么实现

FFT 的快速是怎么个快呢？它是把多项式转成点值表示法，再直接相乘，又换回来系数表示法。

类似的，这时我们只需要找到一个变换 $T$ ，对于所有的卷积，都有
$T(A\cdot B)=T(A)\cdot T(B)$
$IT(T(A\cdot B))=A\cdot B$

其中第一条式子后面的点乘为同次系数相乘， $I T$ 表示 $T$ 的逆变换。

下面简单介绍或、与和异或这三种常用卷积的 FWT 方法。

或卷积

想办法构造一个变换 $T$ ，满足上述条件。

默认 $n$ 为 $2$ 的幂。

以下记 $[i ∣ j = j]$ 为 $i\subseteq j$

多项式 $A$ 经过变换后是一个数组。

记变换后的 $A$ 的第 $k$ 项 $T(A)_k=\sum\limits_{j\sube k}A_j$

则 $T(A\cdot B)_p=\sum\limits_{i\sube p}\sum\limits_{j|k=i}A_jB_k=\sum\limits_{(j|k)\sube p}A_jb_k$

这时有个命题： $(i|j)\sube p\iff (i\sube p)\land(j\sube p)$

怎么证明呢？

首先看 $i\sube j$ 意味着什么？说明 $i$ 的二进制位的位置是被 $j$ 的二进制位的位置包含的（这个解释是不是很像集合的用语？所以我才把它记作 $i\sube j$ ）。

$(i|j)\sube p$ 显然说明 $(i\sube p)\land(j\sube p)$ ，反过来是否成立？

$i ∣ j$ 的二进制位为 $1$ 的位置不可能凭空产生，一定是 $i$ 或 $j$ 有。如果 $i|j\not\sube p$ ，由上面的命题 $i$ 或 $j$ 至少有一个不含于 $p$ ，矛盾。于是得证。

则有
$\begin{aligned} T(A\cdot B)_p&=\sum\limits_{(j|k)\sube p}A_jB_k\\ &=\sum\limits_{(j\sube p)\land(k\sube p)}A_jB_k\\ &=\left(\sum\limits_{j\sube p}A_j\right)\left(\sum\limits_{k\sube p}B_k\right)\\ &=T(A)_p\cdot T(B)_p \end{aligned}$

好了，构造出一个合适的变换 $T$ 了，如何快速求它呢，就像 FFT 一样？

同样采用分治的方法。 $T (A)$ 有 $n$ 项，一开始是一整个块，每次分治把每个整块分成两块。

对于一个长度大于 $1$ 的块 $B$ ，设其长度为 $m$ ，左边的块为 $B_0$ ，右边的块为 $B_1$ 。

对于在块 $B$ 的下标 $x_0$ ，和 $x_0+\frac m2$ 相比，二进制位只有一位不同。

观察 $T(B)_{x_0}$ 和 $T(B)_{x_0+\frac m2}$ 的关系。

$T(A)_{x_0}=\sum\limits_{j\sube x_0}A_j$
$T(A)_{x_0+\frac m2}=\sum\limits_{j\sube(x_0+\frac m2)}A_j$

容易得到 $\forall j\sube x_0$ ，有 $j\sube(x_0+\frac m2)$ 。

意思是 $T(A)_{x_0}$ 的贡献可以加到 $T(A)_{x_0+\frac m2}$ 里。

这时可以得出一个式子：
$T(A)=\operatorname{merge}(T(A_0),T(A_1)+T(A_0))$

其中 $\operatorname{merge}$ 表示数组拼接。

逆变换的分治的式子如下
$IT(A)=\operatorname{merge}(IT(A_0),IT(A_1)-IT(A_0))$

感性理解，正变换在原来的基础上加上了 $T(A_0)$ ，逆变换时就要减掉 $IT(A_0)$ 。

下面是代码实现

void fwt_or(ll a[],ll fl)
{
    for(int i=2;i<=n;i<<=1){
        for(int j=0;j<n;j+=i){
            for(int k=j;k<j+i/2;k++){
                a[k+i/2]=(a[k+i/2]+fl*a[k]+mod)%mod;
            }
        }
    }
}

与卷积

和或卷积类似，构造变换 $T$ 。

上面或卷积构造 $T$ 的方法实际上是利用了 $(i|j)\sube p\iff (i\sube p)\land(j\sube p)$ 的性质。

这里也要弄出类似的命题。

记 $[i\&j=i]$ 为 $i\sube j$ 。

有 $p\sube(i\&j)\iff(p\sube i)\land(p\sube j)$

所以设 $T(A)_p=\sum\limits_{p\sube i}A_i$

可得
$\begin{aligned} T(A\cdot B)_p&=\sum\limits_{p\sube(i\&j)}A_iB_j\\ &=\sum\limits_{(p\sube i)\land(p\sube j)}A_iB_j\\ &=\left(\sum\limits_{p\sube i}A_i\right)\left(\sum\limits_{p\sube j}B_j\right)\\ &=T(A)_p\cdot T(B)_p \end{aligned}$

要求 $T (A)$ 同样分治，直接给出式子。
$T(A)=\operatorname{merge}(T(A_0)+T(A_1),T(A_1))$

符号和字母意义同上。

这里的式子和上面或卷积的不一样。这里是由后面贡献前面，为什么呢？

因为对于一个大小大于一的块 $B$ ，长度为 $m$ ，如果 $x_0$ 是块 $B$ 里的下标，一定满足 $x_0\sube(x_0+\frac m2)$ ，所以只能用右边给左边做贡献。

至于逆变换也和上面差不多，为
$IT(A)=\operatorname{merge}(IT(A_0)-IT(A_1),IT(A_1))$

代码实现如下

void fwt_and(ll a[],ll fl)
{
    for(int i=2;i<=n;i<<=1){
        for(int j=0;j<n;j+=i){
            for(int k=j;k<j+i/2;k++){
                a[k]=(a[k]+fl*a[k+i/2]+mod)%mod;
            }
        }
    }
}

异或卷积

到了异或，情况就比上面复杂多了。

首先得知道一个性质，设 $d_n$ 为 $n$ 的二进制中 $1$ 的个数的奇偶性。

则有 $d_n\oplus d_m=d_{n\oplus m}$

证明如下

等号左边代表 $n, m$ 二进制 $1$ 的个数之和的奇偶性。
异或操作里面对于每一位如果都是 $1$ 结果为 $0$ ，减少的 $1$ 是两个，而其他情况 $1$ 的数量是不会减少。因为减少两个 $1$ 不会改变奇偶性，得证。

根据这个结论，可推出
$\begin{aligned} d_{i\&p}\oplus d_{j\&p}&=d_{(i\&p)\oplus(j\&p)}\\ &= d_{(i\oplus j)\&p} \end{aligned}$

有什么式子的值会随着奇偶性的变化而变化呢？就是 $1)^n$ 。

所以令 $T(A)_p=\sum\limits_{i=0}^{n-1}(-1)^{d_{i\&p}}A_i$

则有
$\begin{aligned} T(A\cdot B)_p&=\sum\limits_{i=0}^{n-1}(-1)^{d_{(j\oplus k)\& p}}A_jB_k\\ &=\sum\limits_{i=0}^{n-1}(-1)^{d_{j\&p}\oplus d_{k\&p}}A_jB_k\\ &=\left(\sum\limits_{i=0}^{n-1}(-1)^{d_{j\& p}}A_j\right)\left(\sum\limits_{i=0}^{n-1}(-1)^{d_{k\&p}}B_k\right)\\ &=T(A)_p\cdot T(B)_p \end{aligned}$

分治求出 $T (A)$ 的式子如下：
$T(A)=\operatorname{merge}(T(A_0)+T(A_1),T(A_0)-T(A_1))$

怎么证明呢？

考虑较小的前 $i$ 位，不考虑其他位。

分成的两个小块对应的位， $p$ 只有第 $(i - 1)$ 位才会改变。

对于前半部分 $p$ 的那一位为 $0$ ，有 $0\&0=0,0\&1=0$ ，发现结果都是 $0$ 不会有影响，所以都加起来。

对于后半部分 $p$ 的那一位为 $1$ ，有 $1\&0=0,1\&1=1$ ，前半部分为 $0$ 不变，后半部分为 $1$ ，所以贡献会乘上 $- 1$ 。

而逆变换就是反过来
$IT(A)=\operatorname{merge}\left(\frac{IT(A_0)+IT(A_1)}2,\frac{IT(A_0)-IT(A_1)}2\right)$

手动验证一下

$\dfrac{IT(A_0)+IT(A_1)}2+\dfrac{IT(A_0)-IT(A_1)}2=IT(A_0)$

$\dfrac{IT(A_0)+IT(A_1)}2-\dfrac{IT(A_0)-IT(A_1)}2=IT(A_1)$

结果是正确的。

代码实现如下

void fwt_xor(ll a[],ll fl)
{
    for(int i=2;i<=n;i<<=1){
        for(int j=0;j<n;j+=i){
            for(int k=j;k<j+i/2;k++){
                ll x=a[k]+a[k+i/2],y=a[k]-a[k+i/2]+mod;
                a[k]=x*(fl==1?1:inv2)%mod,a[k+i/2]=y*(fl==1?1:inv2)%mod;
            }
        }
    }
}

例题

P4717 【模板】快速莫比乌斯/沃尔什变换 (FMT/FWT)

参考代码如下

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=17;
const ll mod=998244353,inv2=499122177;
int n;
ll a[1<<N],b[1<<N],A[1<<N],B[1<<N];
void fwt_or(ll a[],ll fl)
{
    for(int i=2;i<=n;i<<=1){
        for(int j=0;j<n;j+=i){
            for(int k=j;k<j+i/2;k++){
                a[k+i/2]=(a[k+i/2]+fl*a[k]+mod)%mod;
            }
        }
    }
}
void fwt_and(ll a[],ll fl)
{
    for(int i=2;i<=n;i<<=1){
        for(int j=0;j<n;j+=i){
            for(int k=j;k<j+i/2;k++){
                a[k]=(a[k]+fl*a[k+i/2]+mod)%mod;
            }
        }
    }
}
void fwt_xor(ll a[],ll fl)
{
    for(int i=2;i<=n;i<<=1){
        for(int j=0;j<n;j+=i){
            for(int k=j;k<j+i/2;k++){
                ll x=a[k]+a[k+i/2],y=a[k]-a[k+i/2]+mod;
                a[k]=x*(fl==1?1:inv2)%mod,a[k+i/2]=y*(fl==1?1:inv2)%mod;
            }
        }
    }
}
int main()
{
    scanf("%d",&n);
    n=1<<n;
    for(int i=0;i<n;i++) scanf("%lld",&a[i]);
    for(int i=0;i<n;i++) scanf("%lld",&b[i]);
    for(int i=0;i<n;i++) A[i]=a[i],B[i]=b[i];
    fwt_or(A,1),fwt_or(B,1);
    for(int i=0;i<n;i++) A[i]=A[i]*B[i]%mod;
    fwt_or(A,-1);
    for(int i=0;i<n;i++) printf("%lld ",A[i]);
    puts("");
    for(int i=0;i<n;i++) A[i]=a[i],B[i]=b[i];
    fwt_and(A,1),fwt_and(B,1);
    for(int i=0;i<n;i++) A[i]=A[i]*B[i]%mod;
    fwt_and(A,-1);
    for(int i=0;i<n;i++) printf("%lld ",A[i]);
    puts("");
    for(int i=0;i<n;i++) A[i]=a[i],B[i]=b[i];
    fwt_xor(A,1),fwt_xor(B,1);
    for(int i=0;i<n;i++) A[i]=A[i]*B[i]%mod;
    fwt_xor(A,-1);
    for(int i=0;i<n;i++) printf("%lld ",A[i]);
}