FWT(Fast Walsh Transformation)快速沃尔什变换学习笔记

最新推荐文章于 2024-01-21 21:18:35 发布

置顶 VictoryCzt

最新推荐文章于 2024-01-21 21:18:35 发布

阅读量999

点赞数 3

分类专栏： OI数论文章标签： FWT 数论

本文链接：https://blog.csdn.net/VictoryCzt/article/details/80879652

版权

OI数论专栏收录该内容

42 篇文章 3 订阅

订阅专栏

引入

对于两个多项式，形如
$a_0\times x^0+a_1\times x^1+\dots+a_n\times x^n$

我们将其记为 $f (x)$ 与 $g (x)$ ，当我们需要快速求 $h (x) = f (x) * g (x)$ (卷积)时，我们就会用 $\rm FFT$ 算法来解决这个问题。
而 $\rm FWT$ 就是来解决集合上的一类卷积问题。

前言

在比赛与平时练题时，我们常常会遇到一些关于集合的动态规划的问题，比如集合的方案数计数，某些集合的权值计算等，但是一般推出的递推式复杂度会成指数或者阶乘之高，是无法忍受的，但是又没有好的解决方法，于是就放弃去打爆力算了。

那么对于两个集合，形如
$\{a_0,a_1,a_2,\dots,a_n\}$

我们将其记为 $A$ 与 $B$ ，现在又两个分别定义在 $A$ 和 $B$ 的函数 $f$ 与 $g$ ，现有另一个定义在集合上的函数 $h$ 。对于一个集合 $S$ ， $h_S$ 的计算方式如下，我们用 $O$ 表示全集，其中 $A\subseteq O,B\subseteq O,S \subseteq O$ 。
$h_S=\sum_{I\subseteq O}\sum_{J\subseteq O}[I\bigotimes J=S]f_I\times g_J$

这里 $\bigotimes$ 为一类集合的运算，一般为 $\bigcup \bigcap \bigoplus$ (交，并，对称差)，这个便是集合的卷积。

那么有没有类似FFT的方法快速计算两个集合之间的卷积呢?若有不就可以解决前言中的问题了?答案肯定是有的。

前置

集合幂级数

对数列理论熟悉的读者应该知道，我们可以把一个数列 $f_0,f_1,f_2,\dots$ 和一个形式幂级数 $f(x)=\sum_{0≤k}\ f_k\times x^k$ 相对应，称之为该数列的生成函数。由于有很多相关的理论与快速算法，这个方法就能解决很多的数列的计算问题。

那么我们对于集合也定义类似的东西，看看能否达到同样的效果。

设 $F$ 是一个域，则称函数 $f:O\ ->\ F$ 为 $F$ 上的一个集合幂级数，对于一个集合 $S(S\subseteq O)$ ，我们令 $f_S$ 为把 $S$ 带入函数 $f$ 时的函数值，同样的将 $f_S$ 称为该集合幂级数的第 $S$ 项的系数。那么如果所有的 $f_S$ 确定了的话，该函数 $f$ 也就确定了。

那么我们设 $f, g$ 为集合幂级数，定义加法 $f + g = h$ ， $h$ 也是一个集合幂级数，且对于一个集合 $S$ ，满足如下式子:
$h_S=f_S+g_S$

所以，集合幂级数的加法就是对应系数相加，减法同理，改为 $f_S-g_S$ 即可。

下面我们定义集合幂级数的具体形式。参照形式幂级数的样子，我们定义如下: 对于任意的 $v\in F,S\subseteq O$ ，我们用 $v\times x^S$ 表示 $f$ 函数中的第 $S$ 项的系数为 $v$ 。

那么对于一个集合幂级数的函数 $f$ ，形式如下:
$f=\sum_{S\subseteq O}f_S\times x^S$

$f_S\times x^S$ 一般简写为 $f_Sx^S$

我们以此来表示一个集合幂级数。

举个栗子，当 $O=\{1,2\},F=R$ ( $R$ 表示实数集)，对于该函数 $f$ ，我们可以用 $f(x)=3x^{∅}+7x^{\{1\}}+6x^{\{2\}}+9x^{\{1,2\}}$ 来表示一个对应系数为 $3, 7, 6, 9$ 的集合幂级数。

我们同样定义乘法如下，对于集合幂级数 $h, f, g$ ,其中 $h=f\times g$ ，且其中的每一项满足 $\left(f_Ix^I\right)\times \left(g_Jx^J\right)=(f_I\times g_J)x^{I\times J}$ ，那么这个乘法就可以满足交换，结合，分配等定律了。

集合的并，交，对称差卷积

并

我们令三个集合幂级数 $f, g, h$ ，其中 $h$ 满足如下式子:
$h_S=\sum_{I\subseteq O}\sum_{J\subseteq O}[I \bigcup J = S]f_I\times g_J$

那么我们称 $h$ 为 $f, g$ 的集合并卷积，简记为 $f\bigodot g=h$ 。

交

我们令三个集合幂级数 $f, g, h$ ，其中 $h$ 满足如下式子:
$h_S=\sum_{I\subseteq O}\sum_{J\subseteq O}[I \bigcap J = S]f_I\times g_J$

那么我们称 $h$ 为 $f, g$ 的集合交卷积，简记为 $f\bigodot g=h$ 。

对称差

我们令三个集合幂级数 $f, g, h$ ，其中 $h$ 满足如下式子:
$h_S=\sum_{I\subseteq O}\sum_{J\subseteq O}[I \bigoplus J = S]f_I\times g_J$

那么我们称 $h$ 为 $f, g$ 的集合对乘差卷积，简记为 $f\cdot g=h$ 或者 $f\times g$ （能看懂就行）。

对于如上的三个卷积，显然都可 $O(|O|^2)$ 的时间复杂度计算(括号外面的 $O$ 为时间复杂度的符号，里面的 $O$ 表示全集， $∣ O ∣$ 表示全集大小)。

但是这样肯定不能解决大多数问题，那么我们需要考虑快速算法。

分治是一种降低复杂度的好方法，那么这个能否分治呢？

我们将全集 $O$ 中的一个元素 $w$ 单独提出，也就是对于所有含 $w$ 的集合提一个 ${w}$ 出来，那么 $f$ 可以写成由两个集合组合出来的函数， $f^-$ 表示不含 ${w}$ 的部分， $f^+$ 表示含有 ${w}$ 的部分，那么 $f=f^-+x^{\{w\}}f^+$ ，由此我们可以把原式写成如下形式 $f\times g=\left(f^-+x^{\{w\}}f^+\right)\times \left(g^-+x^{\{w\}}g^+\right)$

对于不同的 $\bigodot$ ，我们可以将其化简成不同的形式。

$\bigodot=\bigcup$ 时

由于当前的运算为并，那么 $x^{\{w\}}\times x^{\{\}}=x^{\{w\}}$ , $x^{\{w\}}\times x^{\{w\}}=x^{\{w\}}$ ， $x^{\{\}}\times x^{\{\}}=x^{\{\}}$ (有元素 $w$ 的与没有的并起来就有元素 $w$ ,都有元素 $w$ 并起来还是有，都没有并起来就还是没有)。

所以我们进行如下化简:
$f\times g=\left(f^-+x^{\{w\}}f^+\right)\times \left(g^-+x^{\{w\}}g^+\right)$
$=f^-\times g^-+x^{\{w\}}\times \left(f^-\times g^+\right)+x^{\{w\}}\times \left(f^+\times g^-\right)+x^{\{w\}}\times \left(f^+\times g^+\right)$
这里将乘号略写
$=f^-g^-+x^{\{w\}}\left(f^-g^+\ + f^+g^-+f^+g^+\right)$

将其化简为乘积的形式
$=f^-g^-+x^{\{w\}}\left(\left(f^-+f^+\right)\times \left(g^-+g^+\right)-f^-g^-\right)$

我们将其看作两种形式，第一种为单独的 $f^-$ 或 $g^-$ ，另一种为单独的 $f^-+f^+)$ 或 $g^-+g^+)$ ，那么我们通过分治的方法，先将 $f$ 和 $g$ 分别变化成 $f^`=\left(f^-,\left(f^-+f^+\right)\right)$ 和 $g^`=\left(g^-,\left(g^-+g^+\right)\right)$
然后对应的项乘起来，我们令 $h^`=f^`\times g^`$ ，此时 $h^`=(h^-,h^+)=(f^-g^-,(f^-+f^+)\times (g^-+g^+))$ ，但是此时的 $h^`$ 并不是我们要求的 $h$ ，联想 $\rm FFT$ 的做法，既然变换过去了，肯定要找个方法变换回来。再看我们推导化简式子的最后有一个 $\left(\left(f^-+f^+\right)\times \left(g^-+g^+\right)-f^-g^-\right)$ ，所以我们将 $h^`$ 变成 $h=(h^-,h^+-h^-)$ ，就可以得到 $h$ 了。

复杂度分析，我们令 $s i z e$ 为元素种类的大小，设总的变换的时间复杂度为 $T (s i z e)$ ，可得 $T(size)=2\times T(size-1)+O(|O|)$ ，其中 $2\times T(size-1)$ 是因为提出一个元素后，元素种类减少1，分成了本来有该元素和本来无该元素的两部分，所以乘2，再加上当前这次变换的复杂度。最后解得总复杂度 $T(size)=O(size\times |O|)$ ，而 $s i z e$ 大小是远远小于由 $s i z e$ 个元素组成的集合的全集 $O$ 的大小的，一般 $O|=2^{size}$ ，复杂度远远低于暴力复杂度，可以看做 $O(nlog_2n)$ 。

说明:例如当前 $s i z e = 3$ ，有 $1, 2, 3$ 元素，那么 $O=\{\{∅\},\{1\},\{2\},\{3\},\{1,2\},\{1,3\},\{2,3\},\{1,2,3\}\}$ ，所以 $O$ 的大小为 $2^{size}=8$ 。

$\bigodot=\bigcap$ 时

同样对于交，我们化简原式，过程略，得到如下式子:

乘号略写~~公式太难打了QAQ~~。
$f\cdot g=f^-g^-+f^+g^-+f^-g^++x^{\{w\}}(g^+f^+)$

说明:因为交是必须两个都有 ${w}$ 元素，最后才会有，否则就没有 ${w}$ 元素。

写成乘积形式
$=\left((f^-+f^+)\cdot(g^-+g^+)-f^+g^+\right)+x^{\{w\}}(g^+f^+)$

同样的，提出类似的部分后，我们可以对 $f, g$ 先自己变换，然后相乘(对应项)，然后再变换一次变回来就可以求出 $h$ 。

其中 $f^`=((f^-+f^+),f^+),g^`=((g^-+g^+),g^+),h=(h^--h^+),h^+$

复杂度同上。

$\bigodot=\bigoplus$ 时

对于对称差，都是大同小异。

化简后得到
$f\cdot g=(f^-g^-+f^+g^+)\cdot x^{\{w\}}(f^-g^++f^+g^-)$

说明:因为对称差计算有点奇怪~~好吧其实也不奇怪~~,两者都有或者都没有该元素，计算出来就没有。只要其中一个有另一个没有，计算出来就有。

所以变换为:

$f^`=((f^-+f^+),(f^--f^+))$
$g^`$ 同理。

$h=(\frac{(h^-+h^+)}{2},\frac{(h^--h^+)}{2})$

自己手推一下应该可以得到。

对称差的另外一种推导方法

我们这么半天，集合幂级数的性质也没太明显用，下面就将对称差的另外一种推导方法。

首先引入如下式子：

对于一个集合 $S$ 有：
$\frac{1}{2^{size}}\sum_{T \subseteq O}(-1)^{|S\bigcap T|}=[S=∅]$

对于证明我们较容易发现，当 $S = \emptyset$ 时 $|S\bigcap T|$ 恒为 $0$ ，那么 $(-1)^{|S\bigcap T|}$ 也就恒为1，又因为 $O|=2^{size}$ ，所以最后除以了一个 $2^{size}$ ，式子的值就为1。对于 $S$ 不为空集，令一个元素 $v\in S$ ，由于 $(-1)^{|S\bigcap (T\bigoplus \{v\})|}$ ，根据对称差的分配律 $S\bigcap (T\bigoplus \{v\})=(S\bigoplus \{v\})\bigcap (T\bigoplus \{v\})=(S\bigcap T)\bigoplus \{v\}$ ，原式等于 $(-1)^{|(S\bigcap T)\bigoplus\{v\}|}$ ，又因为 $S\bigcap T$ 中没有 ${v\}$ 交集大小增加1，有 ${v\}$ 交集大小减少1，所以怎么都要变化1，所以 $(-1)^{|(S\bigcap T)\bigoplus \{v\}|}=-(-1)^{|S\bigcap T|}$ ，那么可以得知 $(-1)^{|S\bigcap T|}+(-1)^{|(S\bigcap T)\bigoplus \{v\}|}=0$ ，由于 $T\bigoplus \{v\} \bigoplus \{v\} = T$ ，所以 $T$ 与 $T\bigoplus \{v\}$ 一一对应，所以最后原式的值肯定为0。

我们接下来看：

$h=f\cdot g$

对于一个集合 $S$ ，可知
$h_S=\sum_{I\subseteq O}\sum_{J\subseteq O}[I \bigoplus J=S]f_I\cdot g_J$
$=\sum_{I\subseteq O}\sum_{J\subseteq O}[I\bigoplus J\bigoplus S=∅]f_I\cdot g_J$
$=\sum_{I\subseteq O}\sum_{J\subseteq O}\frac{1}{2^{size}}\sum_{T \subseteq O}(-1)^{|(I\bigoplus J\bigoplus S)\bigcap T|}\ f_I\cdot g_J$
$=\sum_{I\subseteq O}\sum_{J\subseteq O}\frac{1}{2^{size}}\sum_{T \subseteq O}(-1)^{|T\bigcap I|}(-1)^{|T\bigcap J|}(-1)^{|T\bigcap S|}\ f_I\cdot g_J$

说明:这里能这样变换是因为 $(-1)\times (-1)=1$ 对答案无影响，会消掉，所以如果 $I\bigoplus J\bigoplus S$ 有或者没有某个元素，和 $T$ 交后，会被如上方法抵消影响。

举个栗子： $I, J, S$ 的某个元素 ${v\}$ 的有无情况如下(因为都与 $T$ 相交，所以可以不管 $T$ 的影响):
${1,0,0\} \{0,1,0\} \{0,0,1\} \{1,1,1\}$ ，此时 $I\bigoplus J\bigoplus S$ 会有该元素，但是三种情况分别为 $1)^1,(-1)^3$ 都为 $- 1$ 不变，同样 $I\bigoplus J\bigoplus S$ 没有该元素的都为 $1$ 不变，所以可以拆开，其实因为$\bigoplus $出来有该元素必须有奇数个 1 ，无该元素必须有偶数个 1 ，所以$ (-1) $的奇数次方为 - 1 ，偶数次方为 0 ，而奇数$ \bigoplus $出来有该元素，就是$ (-1)^{1$还是$-1$，偶数没有，就是$(-1)}0$，所以为1。

$=\frac{1}{2^{size}}\sum_{T\subseteq O}(-1)^{|T\bigcap S|}\left(\sum_{I\subseteq O}(-1)^{|T\bigcap I|}f_I\right)\left(\sum_{J\subseteq O}(-1)^{|T\bigcap J|}g_J\right)$

这里前半部分 $\frac{1}{2^{size}}\sum_{T\subseteq O}(-1)^{|T\bigcap S|}$ 只有当 $S = \emptyset$ 时后半部分才为1，所以这个式子的值为1，然后对于单个集合 $f$ 的变换，我们可以将集合 $g$ 看作一个常量，也就是式子最后半部分关于 $g$ 的那个括号里的值可以看作1，所以这种形式可以启发我们定义以下变换。

这样我们就可以定义一种变换，对于一个集合幂级数 $f$ ，我们定义它的沃尔什变换为集合幂级数 $f^{\wedge}$ ,其中:
$f^{\wedge }_S=\sum_{T\subseteq O}f_T(-1)^{|S\bigcap T|}$

其逆变换同样由上面推导式得到:
$f_S=\frac{1}{2^{size}}\sum_{T\subseteq O}f^{\wedge}_T(-1)^{|S\bigcap T|}$

再从集合对称差卷积得到:
$h^{\wedge}_S=f^{\wedge}_S g^{\wedge}_S$

于是我们先可以对 $f, g$ 做沃尔什变换，再相乘得到 $h^{\wedge}$ 然后对其做沃尔什逆变换得到答案 $h$

这里可以用递推的方法，我们设 $f^{\wedge (i)}_S$ 为只考虑那些与 $S$ 的对称差是 $\{1,\dots ,i\}$ 的子集的沃尔什变换的第 $S$ 项(也就是 $T\bigoplus S\subseteq \{1,\dots ,i\}$ 的集合 $T$ 的 $f_T(-1)^{|S\bigcap T|}$ 之和)，这里容易得到对于不包含 $i$ 的 $S$ 有
$f^{\wedge (i)}_S=f^{\wedge (i-1)}_S-f^{\wedge (i-1)}_{S\bigcup \{i\}}$

$f^{\wedge (i)}_{S\bigcup \{i\}}=f^{\wedge (i-1)}_S+f^{\wedge (i)}_{S\bigcup \{i\}}$

说明:对于第一个式子,不含有 ${i\}$ 元素的 $f^{\wedge (i)}_S$ 根据定义式 $=\sum_{T\subseteq O}f_T(-1)^{|S\bigcap T|}$ ，将其拆分为两部分 $=\sum_{T\subseteq O}f_T(-1)^{|S\bigcap T|}[\{i\}\notin T]+\sum_{T\subseteq O}f_T(-1)^{|S\bigcap T|}[\{i\}\in T]$ ,对于前半部分因为已经是 $S$ 不含有 $i$ 了，但是对于后者，我们要用 $S\bigcup \{i\}$ 来表示，所以当 $S$ 换成 $S\bigcup \{i\}$ 时， $|S\bigcap T|$ 变成 $|(S\bigcup \{i\})\bigcap T|$ ，它的集合大小会增加1，因为开始 $S$ 中没有 ${i\}$ ，交出来也没有，后面 $|S\bigcup \{i\}|$ 中有了，所以交出来就比原来多了一个 ${i\}$ (这里的 $T$ 中是有 ${i\}$ 的),所以 $\sum_{T\subseteq O}f_T(-1)^{|S\bigcap T|}[\{i\}\in T]=-\sum_{T\subseteq O}f_T(-1)^{|(S\bigcup \{i\})\bigcap T|}\ \ \ \ \ [\{i\}\in T]$ ，所以可以得到一式。
对于二式，也是同样的道理，开始变成了含有 ${i\}$ 的集合 $S\bigcup \{i\}$ ,同样用定义式将其拆成两部分 $\sum_{T\subseteq O}f_T(-1)^{|(S\bigcup \{i\})\bigcap T|}\ \ \ \ \ [\{i\}\notin T]+\sum_{T\subseteq O}f_T(-1)^{|(S\bigcup \{i\})\bigcap T|}\ \ \ \ \ [\{i\}\in T]$ ，然后后半部分已经为 $S\bigcup \{i\}$ 所以要将前半部分变成没有 ${i\}$ 的 $S$ ,同样来看， $|(S\bigcup \{i\})\bigcap T|$ 和 $|S\bigcap T|$ 没有变化，因为这里的 $T$ 是不包含 ${i\}$ 元素的，所以可以得到二式。

但是对于最底层的 $f^{\wedge (0)}_S$ ，根据定义来看，我们最底层的 $T$ 只能等于 $S$ ，这样 $S\bigoplus T=∅$ ，所以 $f^{\wedge (0)}_S$ ，当 $S$ 大小为奇数时它等于 $f_S$ ，为偶数时他就等于 $f_S$ ，这样十分不好处理，所以我们统一规定， $f^{\wedge (0)}_S=f_S$ ，那么对于上面求出的式子也要进行改动。

我们这里假设 $(-1)^{|S\bigcap T|}=1$ ,那么 $(-1)^{|(S\bigcup \{i\})\bigcap T|}=-1$ ,(其实反过来也可以，虽然式子符号（正负）会变，最终的答案不会改变),因为后者会比前者多一个元素 ${i\}$ ，所以 $f^{\wedge (i)}_{S\bigcup \{i\}}$ 本来要乘以 $- 1$ ，又因为我们上面的重定义，所以不能乘以 $- 1$ ，所以对于后者要取相反数，这里我们便得到了最终的集合对称差卷积的沃尔什变换的式子:
$f^{\wedge (i)}_S=f^{\wedge (i-1)}_S+f^{\wedge (i-1)}_{S\bigcup \{i\}}$

$f^{\wedge (i)}_{S\bigcup \{i\}}=f^{\wedge (i-1)}_S-f^{\wedge (i)}_{S\bigcup \{i\}}$

其实也就和之前的证明方法的结果相同了， $f^{\wedge}=(f^-+f^+,f^--f^+)$ 。

逆变换也就是原来的变换乘以了 $\frac{1}{2^{size}}$ ，所以我们发现这里可以不用像原来的逆变换每次除以2，可以做顺变换，最后答案除以 $2^{size}$ 即可。

注：对于其它两个集合运算也有类似的证明，但是过于繁琐，而且实际应用中集合对称差用到此证明公式的最多，所以其余两个就不讲此类证法，有兴趣的读者可自行查阅资料。

到这里，沃尔什变换就大概完整了。

三种卷积的变换与逆变换

集合并 $\bigcup$

沃尔什变换 $f^{\wedge}=(f^-,f^-+f^+)$
沃尔什逆变换 $f=(f^{\wedge -},f^{\wedge +}-f^{\wedge -})$

集合交 $\bigcap$

沃尔什变换 $f^{\wedge}=(f^-+f^+,f^+)$
沃尔什逆变换 $f=(f^{\wedge -}-f^{\wedge +},f^{\wedge +})$

集合对称差 $\bigoplus$

沃尔什变换 $f^{\wedge}=(f^-+f^+,f^--f^+)$
沃尔什逆变换 $f=(\frac{f^{\wedge -}+f^{\wedge +}}{2},\frac{f^{\wedge -}-f^{\wedge +}}{2})$

注意：在取模运算时，除2要变成乘以2对应的逆元。

那么对于全集的每个元素，我们可以用0或者1来表示它是否在某个集合里，就可以用一个二进制数来表示集合，这在运算上就十分方便了，原因如下:

对于集合并，它就相当于位运算中的 $∣ (o r)$ ， $1011\bigcup0110=1111$ , $1011 ∣ 0110 = 1111$ 。
对于集合交，它就相当于位运算中的&(and)， $1011\bigcap0110=0010$ , 1011&0110=0010。
对于集合对称差，你应该想到了，没错，它就是 ${\wedge} (xor)$ ， $1011\bigoplus 0110 = 1101$ ， $1011\wedge 0110 = 1101$

那么由于位运算每一位之间互不影响，所以我们可以把它按照当前位为0或1分治，也就是表示当前元素有无分治。

但是递归虽然可以，有时常数以及实际效率并不是很优秀，所以我们考虑不用递归的形式。

我们发现它的全集 $O$ ，可以用二进制数全部表示出来，转换为十进制来看就是 $\{0,1,2,\dots ,2^{size}-1\}$ ，其中 $0$ 表示 $\emptyset$ 。

那么我们来看二进制的形式：

${0,1,2,3,4,5,6,7\}$ 就等于

${000,001,010,011,100,101,110,111\}$

我们发现对于第 $i$ 位(从右往左数)，它为 $0$ 相隔 $2^{i-1}$ 个数，为 $1$ 也是，如 $1:\{0,1,0,1,0,1,0,1\}$ , $2:\{0,0,1,1,0,0,1,1\}$ , $3:\{0,0,0,0,1,1,1,1\}$ ，以此类推，所以我们可以用循环来代替递归。

第一层循环，枚举当前为第 $i$ 位

for(int bit=1;bit<(1<<size);bit<<=1)

第二次枚举当前连续的一段0和1

int inc=bit<<1;
for(int i=0;i<(1<<size);i+=inc)

依次枚举这一段对应的0和1,

for(int j=0;j<bit;j++)

那么我们用 $x$ 表示0这一位， $y$ 表示1这一位，那么就有

x=a[i+j],y=a[i+j+bit];
//eg.当前这一位是{0,0,1,1,0,0,1,1}
//               |   |
//               i   i+bit
// j {0~1}

所以对于三种变化我们计算如下

运算方式	or并	and交	xor对称差
沃尔什变换	a[i+j+bit]=x+y	a[i+j]=x+y	a[i+j]=x+y,a[i+j+bit]=x-y
沃尔什逆变换	a[i+j+bit]=y-x	a[i+j]=x-y	a[i+j]=(x+y)/2,a[i+j+bit]=(x-y)/2

那么代码就很容易写了。
模板题目

Luogu P4717
#include<cstdio>
#include<cstring>
#include<algorithm>
#define ll long long
using namespace std;
const int M=1<<19;
const ll mod=998244353ll;
int n;
ll A[M],B[M];
ll a[M],b[M];
ll c[3][M],inv;
ll pow(ll a){
    ll b=mod-2,ans=1;
    for(;b;b>>=1,a=(a*a)%mod){
        if(b&1) ans=(ans*a)%mod;
    }
    return ans;
}
void WT(ll *w,int n,int f,int type){
    ll x,y;
    //type:0 or,1 and,2 xor
    //f=1 沃尔什变换 f=-1 沃尔什逆变换
    for(int d=1;d<n;d<<=1){
        for(int ad=d<<1,i=0;i<n;i+=ad){
            for(int j=0;j<d;j++){
                x=w[i+j],y=w[i+j+d];
                if(f==1){
                    switch(type){
                        case 0:{
                            w[i+j+d]=(x+y)%mod;
                            break;
                        }
                        case 1:{
                            w[i+j]=(x+y)%mod;
                            break;
                        }
                        case 2:{
                            w[i+j]=(x+y)%mod;
                            w[i+j+d]=(x-y+mod)%mod;
                            break;
                        }
     				}
                }else{
                    switch(type){
                        case 0:{
                            w[i+j+d]=(y-x+mod)%mod;
                            break;
                        }
                        case 1:{
                            w[i+j]=(x-y+mod)%mod;
                            break;
                        }
                        case 2:{
                            w[i+j]=(x+y)*inv%mod;
                            w[i+j+d]=(((x-y)*inv%mod)+mod)%mod;
                            break;
                        }
                    }
                }
            }
        }
    }
}
void FWT(ll *a,ll *b,int n){
    for(int f=0;f<3;f++){
        memset(A,0,sizeof(A));memset(B,0,sizeof(B));
        for(int i=0;i<n;i++) A[i]=a[i],B[i]=b[i];
        WT(A,n,1,f);WT(B,n,1,f);
        for(int i=0;i<n;i++) A[i]=(A[i]*B[i])%mod;
        WT(A,n,-1,f);
        for(int i=0;i<n;i++) c[f][i]=(A[i]%mod+mod)%mod;
    }
}

int main(){
    inv=pow(2);
    scanf("%d",&n);n=(1<<n);
    for(int i=0;i<n;i++) scanf("%lld",&a[i]);
    for(int i=0;i<n;i++) scanf("%lld",&b[i]);
    FWT(a,b,n);
    for(int i=0;i<3;i++){
        for(int j=0;j<n;j++) printf("%lld ",c[i][j]);puts("");
    }
    return 0;
}

hdxrie的更简洁的模板IN THERE
其中有一些简单的特判，避免了我的switch语句的麻烦。(感谢hdxrie提供)

而暴力计算其实十分简单，为了方便理解，这里放一份暴力代码。

#include<cstdio>
#include<cstring>
#include<algorithm>
#define ll long long
using namespace std;
const int M=1<<19;
const ll mod=998244353ll;
int n;
ll a[M],b[M];
ll cxor[M],cor[M],cand[M];
int main(){
    scanf("%d",&n);
    if(n>13) return 0;
    n=(1<<n);
    for(int i=0;i<n;i++)scanf("%lld",&a[i]);
    for(int i=0;i<n;i++)scanf("%lld",&b[i]);
    for(int i=0;i<n;i++){
        for(int j=0;j<n;j++){
            ll now=(a[i]*b[j])%mod;
            (cor[i|j]+=now)%=mod;
            (cxor[i^j]+=now)%=mod;
            (cand[i&j]+=now)%=mod;
        }
    }
    for(int i=0;i<n;i++) printf("%lld ",cor[i]);puts("");
    for(int i=0;i<n;i++) printf("%lld ",cand[i]);puts("");
    for(int i=0;i<n;i++) printf("%lld ",cxor[i]);puts("");
    return 0;
}