特殊卷积的多项式环以及 Walsh变换

山登绝顶我为峰 3(^v^)3

已于 2022-05-13 11:37:32 修改

阅读量378

点赞数

分类专栏：代码数学文章标签：算法线性代数信息安全计算机抽象代数

于 2022-05-12 19:42:21 首次发布

本文链接：https://blog.csdn.net/weixin_44885334/article/details/124738110

版权

代码同时被 2 个专栏收录

37 篇文章 1 订阅

订阅专栏

数学

33 篇文章 6 订阅

订阅专栏

本文探讨了特殊卷积，包括Convolution、XOR-Convolution、OR-Convolution和AND-Convolution，它们基于比特运算在多项式环结构中形成交换环。文章介绍了这些运算的定义、环的性质以及如何通过快速数论变换和沃尔什变换进行高效计算，如NTT和FWT。

摘要由CSDN通过智能技术生成

特殊卷积

Convolution：

$h_k = \sum_{i+j=k \mod n} a_i b_j$

XOR-Convolution：

$h_k = \sum_{i \oplus j=k} a_i b_j$

OR-Convolution：

$h_k = \sum_{i \vee j=k} a_i b_j$

AND-Convolution：

$h_k = \sum_{i \wedge j=k} a_i b_j$

上述的 $\oplus,\vee,\wedge$ 都是比特运算，序列 $h, a, b$ 长度为 $n=2^l$

特殊卷积的多项式环

作者的推导如有问题，还请读者积极指正！ (*￣︶￣)

一般结构

对于代数结构 $R=(Z_p[x],+,\cdot)$ ，元素表示为 $\sum_{i=0}^{n-1} f_i x^i \in Z_p[x]$ ，其中的 $f_i \in \mathbb Z_p$ 是素域元素。 $R$ 的运算定义如下：
$\sum_{i=0}^{n-1} (f_i+g_i) x^i$

其中，左侧的运算符 $+$ 是多项式加法，右侧的运算符 $+$ 是素域加法，而运算符 $\sum$ 是交换的单项式连接符（也就是多项式加法算符）。

$\cdot g(x) = \sum_{k=0}^{n-1} (\sum_{i \circ j=k} f_i \cdot g_j) x^k$

其中，左侧的运算符 $\cdot$ 是多项式乘法，右侧的运算符 $\cdot$ 是素域乘法，而运算符 $\circ$ 是对于 $\mathbb Z$ 上元素的某种交换的二元运算。

那么， $R$ 是交换环：

因为素域 $Z_p$ 对加法构成交换加法群，易知 $R$ 是加群
验证 $R$ 满足结合律，
$\begin{aligned} (f \cdot g) \cdot h &= \sum_{k=0}^{n-1} (\sum_{i \circ j=k} f_i \cdot g_j) x^k \cdot \sum_{l=0}^{n-1} h_l x^l\\ &= \sum_{m=0}^{n-1} (\sum_{l \circ k=m}(\sum_{i \circ j=k} f_i \cdot g_j) \cdot h_l) x^m\\ &= \sum_{m=0}^{n-1} (\sum_{l \circ i \circ j=m} f_i \cdot g_j \cdot h_l) x^m\\ &= f \cdot (g \cdot h)\\ \end{aligned}$
验证 $R$ 满足左右分配律，由于 $Z_p$ 上的乘法是交换的，因此只需验证单边分配律：
$\begin{aligned} (f+g) \cdot h &= \sum_{i=0}^{n-1} (f_i + g_i) x^i \cdot \sum_{j=0}^{n-1} h_j x^j\\ &= \sum_{k=0}^{n-1} (\sum_{i \circ j=k} (f_i + g_i) \cdot h_j) x^k\\ &= \sum_{k=0}^{n-1} (\sum_{i \circ j=k} (f_i\cdot h_j + g_i\cdot h_j) ) x^k\\ &= \sum_{k=0}^{n-1} (\sum_{i \circ j=k} f_i\cdot h_j)x^k + \sum_{k=0}^{n-1} (\sum_{i \circ j=k} g_i\cdot h_j)x^k\\ &= f \cdot h + g \cdot h \end{aligned}$
若包含幺元 $\sum_{i=0}^{n-1} e_i x^i$ ，它需要满足
$\cdot e(x) = e(x) \cdot g(x) = \sum_{k=0}^{n-1} (\sum_{i \circ j = k} e_i \cdot g_j) x^{k} = \sum_{k=0}^{n-1} g_k x^{k} = g(x)$
即要满足 $g_j = \sum_{i \circ j = k} e_i \cdot g_j$

环的实例化

假设 $R$ 中的多项式长度最高是 $n=2^l,l \in \mathbb N$ ，那么：

选取运算符 $\circ$ 为”模加“，那么为Convolution：
$\cdot g(x) = \sum_{k=0}^{n-1} (\sum_{i + j \equiv k \mod n} f_i \cdot g_j) x^k$
此时，交换环 $R$ 含幺， $\in R$ 。环 $R$ 有零因子，例如 $(x^{n/2}-1)\cdot(x^{n/2}+1)=0$ 。
选取运算符 $\circ$ 为”按位或“，那么为Or Convolution：
$\cdot g(x) = \sum_{k=0}^{n-1} (\sum_{i \vee j=k} f_i \cdot g_j) x^k$
此时，交换环 $R$ 含幺， $\in R$ 。环 $R$ 有零因子，例如 $(x^{n-1}+x^{n/2})\cdot(x^{n/2}-1)=0$ 。
选取运算符 $\circ$ 为”按位与“，那么为And Convolution：
$\cdot g(x) = \sum_{k=0}^{n-1} (\sum_{i \wedge j=k} f_i \cdot g_j) x^k$
此时，交换环 $R$ 含幺， $x^{n-1} \in R$ 。环 $R$ 有零因子，例如 $(x^{n/2}+1)\cdot(x^{n/2-1}-1)=0$ 。
选取运算符 $\circ$ 为”异或“，那么为Xor Convolution：
$\cdot g(x) = \sum_{k=0}^{n-1} (\sum_{i \oplus j=k} f_i \cdot g_j) x^k$
此时，交换环 $R$ 含幺， $\in R$ 。环 $R$ 有零因子，例如 $(x^{n-1}+1)\cdot(x^{n-1}-1)=0$ 。

快速计算卷积

对于Convolution，使用快速数论变换（Number Theoretic Transform）来求解，复杂度 $\log n)$

对于Or Convolution、And Convolution、Xor Convolution，使用快速沃尔什变换（Walsh Transform）来求解，复杂度 $\log n)$

对于NTT，可以参考深入理解NTT，

假设 $A$ 是 $n=2^l$ 长的数组，令 $A_0$ 表示上半段，令 $A_1$ 表示下半段。
令 $w$ 是 $n$ 次单位根，正向变换为：

$\left\{ \begin{aligned} (NTT(A_0 + w A_1),\, NTT(A_0 - w A_1)) &,& n>1\\ A &,& n=1\\ \end{aligned} \right.$

对于FWT，可以参考快速沃尔什变换 FWT，

对于Or Convolution，正向变换为：

$\left\{ \begin{aligned} (FWT(A_0),\, FWT(A_0 + A_1)) &,& n>1\\ A &,& n=1\\ \end{aligned} \right.$

对于And Convolution，正向变换为：

$\left\{ \begin{aligned} (FWT(A_0 + A_1),\, FWT(A_1)) &,& n>1\\ A &,& n=1\\ \end{aligned} \right.$

对于Xor Convolution，正向变换为：

$\left\{ \begin{aligned} (FWT(A_0 + A_1),\, FWT(A_0 - A_1)) &,& n>1\\ A &,& n=1\\ \end{aligned} \right.$

上述各种变换的逆变换是容易推导的，略。

快速卷积的代码实现

NTT

查看有限域上多项式乘法的快速实现

FWT

/* 
	进一步加速方案：
	1.将vector索引改为指针（这个索引花费了3/4的时间）
	2.将取模运算用Barrett算法加速
	3.循环展开
*/

#include <cstdio>
#include <iostream>
#include <algorithm>
#include <vector>
#include "tools.h"

using namespace std;

const int64 P = 998244353;

#define add(x, y) ((x += y) >= P && (x -= P))

#define sub(x, y) ((x -= y) < 0 && (x += P))

struct FWT {
	int64 extend(int64 n) {
		int64 N = 1;
		for (; N < n; N <<= 1);
		return N;
	}
	void FWTor(std::vector<int> &a, bool rev) {
		int64 n = a.size();
		auto p = a.data();
		if (!rev)
			for (int64 l = 2, m = 1; l <= n; l <<= 1, m <<= 1) {
				for (int64 j = 0; j < n; j += l) for (int64 i = 0; i < m; i++) {
					add(p[i + j + m], p[i + j]);
				}
			}
		else
			for (int64 l = 2, m = 1; l <= n; l <<= 1, m <<= 1) {
				for (int64 j = 0; j < n; j += l) for (int64 i = 0; i < m; i++) {
					sub(p[i + j + m], p[i + j]);
				}
			}
	}
	void FWTand(std::vector<int> &a, bool rev) {
		int64 n = a.size();
		auto p = a.data();
		if (!rev)
			for (int64 l = 2, m = 1; l <= n; l <<= 1, m <<= 1) {
				for (int64 j = 0; j < n; j += l) for (int64 i = 0; i < m; i++) {
					add(p[i + j], p[i + j + m]);
				}
			}
		else
			for (int64 l = 2, m = 1; l <= n; l <<= 1, m <<= 1) {
				for (int64 j = 0; j < n; j += l) for (int64 i = 0; i < m; i++) {
					sub(p[i + j], p[i + j + m]);
				}
			}
	}
	void FWTxor(std::vector<int> &a, bool rev) {
		int64 n = a.size(), inv2 = (P + 1) >> 1;
		auto p = a.data();
		if (!rev)
			for (int64 l = 2, m = 1; l <= n; l <<= 1, m <<= 1) {
				for (int64 j = 0; j < n; j += l) for (int64 i = 0; i < m; i++) {
					int64 x = p[i + j], y = p[i + j + m];
					p[i + j] = (x + y) % P;
					p[i + j + m] = (x - y + P) % P;
				}
			}
		else
			for (int64 l = 2, m = 1; l <= n; l <<= 1, m <<= 1) {
				for (int64 j = 0; j < n; j += l) for (int64 i = 0; i < m; i++) {
					int64 x = p[i + j], y = p[i + j + m];
					p[i + j] = (x + y) * inv2 % P;
					p[i + j + m] = (x - y + P) * inv2 % P;
				}
			}
	}
	std::vector<int> Or(std::vector<int> a1, std::vector<int> a2) {
		int64 n = std::max(a1.size(), a2.size()), N = extend(n);
		a1.resize(N), FWTor(a1, false);
		a2.resize(N), FWTor(a2, false);
		std::vector<int> A(N);
		auto p = A.data(), p1 = a1.data(), p2 = a2.data();
		for (int64 i = 0; i < N; i++) p[i] = p1[i] * p2[i] % P;
		FWTor(A, true);
		return A;
	}
	std::vector<int> And(std::vector<int> a1, std::vector<int> a2) {
		int64 n = std::max(a1.size(), a2.size()), N = extend(n);
		a1.resize(N), FWTand(a1, false);
		a2.resize(N), FWTand(a2, false);
		std::vector<int> A(N);
		auto p = A.data(), p1 = a1.data(), p2 = a2.data();
		for (int64 i = 0; i < N; i++) p[i] = p1[i] * p2[i] % P;
		FWTand(A, true);
		return A;
	}
	std::vector<int> Xor(std::vector<int> a1, std::vector<int> a2) {
		int64 n = std::max(a1.size(), a2.size()), N = extend(n);
		a1.resize(N), FWTxor(a1, false);
		a2.resize(N), FWTxor(a2, false);
		std::vector<int> A(N);
		auto p = A.data(), p1 = a1.data(), p2 = a2.data();
		for (int64 i = 0; i < N; i++) p[i] = p1[i] * p2[i] % P;
		FWTxor(A, true);
		return A;
	}
} fwt;

int main() {

	int64 n = 8;
	std::vector<int> A;
	std::vector<int> a1(n), a2(n);

	for (int64 i = 0; i < n; i++) 
		a1[i] = 0;
	a1[0] = 1;
	for (int64 i = 0; i < n; i++) 
		a2[i] = 1+i*2;
	
	printf("a1：");
	for (int64 i = 0; i < n; i++) {
		printf("%d%c", a1[i], " \n"[i == n - 1]);
	}
	printf("a2：");
	for (int64 i = 0; i < n; i++) {
		printf("%d%c", a2[i], " \n"[i == n - 1]);
	}

	A = fwt.Or(a1, a2);
	printf("Or Convolution：");
	for (int64 i = 0; i < n; i++) {
		printf("%d%c", A[i], " \n"[i == n - 1]);
	}

	A = fwt.And(a1, a2);
	printf("And Convolution：");
	for (int64 i = 0; i < n; i++) {
		printf("%d%c", A[i], " \n"[i == n - 1]);
	}

	A = fwt.Xor(a1, a2);
	printf("Xor Convolution：");
	for (int64 i = 0; i < n; i++) {
		printf("%d%c", A[i], " \n"[i == n - 1]);
	}

	printf("\n测试效率：\n");

	n = 1024;
	a1.resize(n);
	a2.resize(n);
	for (int64 i = 0; i < n; i++)
		a1[i] = i;
	for (int64 i = 0; i < n; i++)
		a2[i] = 1 + i * 2;

	Loop(1000, A = fwt.Or(a1, a2));

	Loop(1000, A = fwt.And(a1, a2));

	Loop(1000, A = fwt.Xor(a1, a2));

	return 0;
}

执行结果

a1：1 0 0 0 0 0 0 0
a2：1 3 5 7 9 11 13 15
Or Convolution：1 3 5 7 9 11 13 15
And Convolution：64 0 0 0 0 0 0 0
Xor Convolution：1 3 5 7 9 11 13 15

测试效率：
0.0443006 s
0.0525024 s
0.119512 s