【Applied Algebra】GF(2)上的MQ方程求解:Wu消元法实现

hanss2

已于 2022-09-19 11:12:56 修改

阅读量680

点赞数

分类专栏：代数随感文章标签：线性代数算法人工智能

于 2022-05-18 16:57:17 首次发布

本文链接：https://blog.csdn.net/hanss2/article/details/124844547

版权

随感同时被 2 个专栏收录

73 篇文章 2 订阅

订阅专栏

代数

20 篇文章 11 订阅

订阅专栏

$\mathbb{F}_2$ 上MQ方程的Wu消元法实现

由于Groebner基方法求解MQ问题的困难性,我们先后又尝试了MQ转SAT方法,MQ转SMT方法来求解,但是求解效果仍然有限.在进一步调研后,我们又设计了基于Wu消元法求解算法;更重要的是,我们明确了接下来的道路:只有坚持走实验算法学的道路才能有希望改进 $\mathbb{F}_2$ 上MQ方程求解这样的NP-问题;

本文源代码:MQ方程的Wu消元法实现

$\mathbb{F}_2$ 上MQ方程解的搜索困难性

我们首先来看看 $\mathbb{F}_2$ 上MQ方程的解分布特点:在图中,我们并没有真实地展示解的相对位置(因为那是在 $n$ -维空间里的,无法可视化),我们把 $n$ -维空间里的点(在 $\mathbb{F}^n_2$ 上)嵌入到了 $x$ 轴上,因此 $n$ -维空间里的相邻点并不会在线上体现出相邻,但并不妨碍我们对解的可满足方程数量的随机分布特点的直观认识,可见要找到 $M = 16$ 的点(也就是方程的解)是一个困难的搜索问题;

在这里插入图片描述

Wu消元法求解 $\mathbb{F}_2$ 上MQ问题

Wu消元法的核心算法是"拟除法",我们假设此时有多项式 $\in k[x_1,...,x_n]$ ,它们都包含变元 $x_{i}$ ,也假定变元 $x_{i}$ 的项序最靠前,是下一个待消元的变元,那么我们通过拟除法 $\operatorname{REM}(f,g,x_i)$ 可以得到拟除结果的商和余多项式 $q, r$ ,其中 $r$ 是不含变元 $x_i$ 的,这样我们就得到了消元结果(当然我们不希望看见的是 $r = 0$ );注意,Wu消元法解方程在实际应用中往往比Groebner基方法的效率更高 [1];

我们假设现有多项式方程组 $g_{1},..., g_{m} \in k[x_1,...,x_n]$ ,我们希望通过Wu消元法,得到如下形式的特征列:

$\begin{aligned} f_{1} &=f_{1}(x_{1}) \\ f_{2} &=f_{2}(x_{1}, x_{2}) \\ & \vdots \\ f_{n} &=f_{n}(x_{1}, \ldots, x_{n}) \end{aligned}$

我们期望得到 $f_{1} \neq 0,..., f_{n} \neq 0$ ,这样我们就可以通过这个严格的三角列逐个解出 $x_{1}...x_{n}$ ,但是在现实中,多项式方程组 $g_{1},..., g_{m}$ 具有多个特征列,我们大概率不能得到这样的严格三角列(我们的实验也证明了这一点),在大多数情况下,我们只能得到形如如下形式的三角列:

$\begin{aligned} f_{1} &=f_{1}(x_{1}) = 0 \\ f_{2} &=f_{2}(x_{1}, x_{2}) = 0 \\ & \vdots \\ f_{n} &=f_{n}(x_{1}, \ldots, x_{i}) = 0 \\ & \vdots \\ f_{n} &=f_{n}(x_{1}, \ldots, x_{n-1}) \neq 0 \\ f_{n} &=f_{n}(x_{1}, \ldots, x_{n-1}, x_{n}) \neq 0 \end{aligned}$

这样的三角列也是原方程组的特征列,但是我们就没法依靠它解出原方程了;我们将在后文里讨论如果去求一个严格的三角列,它的本质是一个搜索问题(我们本来想通过消元法来逃避原来的解空间搜索问题,却陷入了另一个搜索问题,所以直观感觉就是MQ问题的本质就是一个搜索问题);

在这里插入图片描述

例.1.(Wu消元法求特征列):考虑 $k[x_1...x_4]$ 上的多项式方程组:命 $\mathcal{P}=\{P_{1}, P_{2}, P_{3}\}$ ,其中

$\begin{aligned} &P_{1}=x_{1} x_{4}^{2}+x_{4}^{2}-x_{1} x_{2} x_{4}-x_{2} x_{4}+x_{1} x_{2}+3 x_{2} \\ &P_{2}=x_{1} x_{4}+x_{3}-x_{1} x_{2} \\ &P_{3}=x_{3} x_{4}-2 x_{2}^{2}-x_{1} x_{2}-1 \end{aligned}$

消元过程如下(输入多项式集合 $\mathcal{P}$ ,输出特征列 $\mathcal{C}$ ):

$\begin{aligned} \mathcal{P}=&\mathcal{F}_{1}=\{P_{1}, P_{2}, P_{3}\} \quad \subset \mathcal{F}_{2}=\{P_{1}, \cdots, P_{5}\} \quad \subset \mathcal{F}_{{3}}=\{P_{1}, \cdots, P_{{6}}\} \\ &\mathcal{B}_{1}=[P_{2}] \quad \quad \quad \mathcal{B}_{2}=[P_{4}, P_{2}] \quad \quad \quad \mathcal{B}_{3}=[P_{6}, P_{4}, P_{2}]=\mathcal{C}\\ &\mathcal{R}_{1}=\{P_{4}, P_{5}\} \quad \quad \quad \mathcal{R}_{2}=\{P_{6}\} \quad \quad \quad \mathcal{R}_{3}=\varnothing, \end{aligned}$

其中, $P_4 = \operatorname{REM}(P_1,P_2,x_4)$ , $P_4 = \operatorname{REM}(P_3,P_2,x_4)$ ,而 $P_6 = \operatorname{REM}(P_4,P_5,x_3)$ ;最终我们可以得到三角特征列:

$\begin{aligned} \mathbb{C} &=[C_{1}, C_{2}, C_{3}] \\ &=[\begin{array}{l} x_{1}(2 x_{1} x_{2}^{2}+2 x_{2}^{2}-2 x_{1} x_{2}+x_{1}+1) \\ x_{1} x_{3}^{2}+x_{3}^{2}-x_{1}^{2} x_{2} x_{3}-x_{1} x_{2} x_{3}+x_{1}^{3} x_{2}+3 x_{1}^{2} x_{2}] \\ x_{1} x_{4}+x_{3}-x_{1} x_{2} \end{array}. \end{aligned}$

上例中我们用到的求特征列的算法形式化如下,其中 $\operatorname{BasSet}(\mathcal{F}, ord)$ 是按照项序 $or d$ 求方程组 $\mathcal{F}$ 的基列,其实质就是找出下一个用来做拟除的除式.

在这里插入图片描述
正如我们前面所说,如上算法求出的特征列并不一定是严格的三角列,事实上,找到一个严格的三角列是很困难的(虽然它在MQ问题的求解中往往是存在的);那么是否存在一种一定找到严格的三角列的算法呢?显然可以,只需要按照项序 $x_1,...,x_n$ ,逐个变元做两两拟除消元即可,但是这样的计算复杂度特别高,我们现在假定 $\mathcal{F}$ 是变元数 $n$ ,方程数 $m$ 的方程组,第一轮消元 $x_1$ 后我们得到 $C^{2}_m$ 个方程,第二轮消元 $x_2$ 后我们得到 $C^{2}_{m(m-1)}$ 个方程(当然其中会有0方程,但是即使是0方程我们也是完成拟除运算才得到的)…以此类推,对于 $n$ 个变元,消元算法的计算复杂度是 $\mathcal{O}(m^n)$ 的,这简直比暴力搜索解的复杂度 $\mathcal{O}(m2^n)$ 还高;

基于以上分析,我们可以看出,计算复杂度是 $\mathcal{O}(m^n)$ 的消元算法的搜索策略是广度优先的,也就是每个变元的特征消元多项式它都要找出来,这其实是没有必要的,因为其实只需要找到对应严格三角列的那个"消元路径"就行了,因此我们设计了深度优先的消元算法;

Wu消元算法运行过程中,按照项序排列的变元对应的消元多项式数量变化示意图,我们从 $x_1$ 开始消元,期待得到非零的 $f_n$ ,这个过程中,一开始多项式数量会急剧膨胀,然后随着变元数量变少,又会很快下降,以至于我们的消元路径常常会在中途某个 $x_i$ 时得到0多项式而终止(如图中路径 $w_2$ 所示)我们期望通过深度优先搜索的方式找到路径 $w_1$ ,得到严格的非零三角特征列:

在这里插入图片描述
深度优先的Wu消元算法的实现如下:

while VAR_ELIMINATED != ITEMS_VARS_USED[-1]:
    print(' ============  '+ str(VAR_ELIMINATED) +'  ================= ');
    INDEX_VAR = ITEMS_VARS_USED.index(VAR_ELIMINATED);
    print('R_m = '+str(len(CHARASTIC_SETS[VAR_ELIMINATED])));
    print('R_m+1 = '+str(len(CHARASTIC_SETS[ITEMS_VARS_USED[INDEX_VAR+1]])));
    if RUNNING_TIMES>50000:break;
    # --- checking stopping ---
    VAR_ELIMINATED_NEXT = ITEMS_VARS_USED[ ITEMS_VARS_USED.index(VAR_ELIMINATED_START)+1 ];
    if len(CHARSET_NUM_RECORD[VAR_ELIMINATED_NEXT])>2000:
        if CHARSET_NUM_RECORD[VAR_ELIMINATED_NEXT][-2000] == len(CHARASTIC_SETS[VAR_ELIMINATED_NEXT]):
           VAR_ELIMINATED_START = ITEMS_VARS_USED[ ITEMS_VARS_USED.index(VAR_ELIMINATED_START) +1];
           VAR_ELIMINATED = VAR_ELIMINATED_START;continue;
    if len(CHARASTIC_SETS[VAR_ELIMINATED])<2:
        VAR_ELIMINATED = VAR_ELIMINATED_START;continue; # back-tracing;
    if len(CHARASTIC_SETS[ITEMS_VARS_USED[-4]])>200 and (ITEMS_VARS_USED.index(VAR_ELIMINATED_START) < ITEMS_VARS_USED.index(ITEMS_VARS_USED[-5])):
        VAR_ELIMINATED_START = ITEMS_VARS_USED[-5];
        VAR_ELIMINATED = VAR_ELIMINATED_START;continue;
    # --- choosing polynomials ---
    if VAR_ELIMINATED==VAR_ELIMINATED_START:POLYNOMIAL_WUBAS = CHARASTIC_SETS[VAR_ELIMINATED][ np.random.randint( len(CHARASTIC_SETS[VAR_ELIMINATED]) ) ];
    POLYNOMIAL_DIV   = CHARASTIC_SETS[VAR_ELIMINATED][ np.random.randint( len(CHARASTIC_SETS[VAR_ELIMINATED]) ) ];
    while POLYNOMIAL_DIV == POLYNOMIAL_WUBAS:POLYNOMIAL_DIV = CHARASTIC_SETS[VAR_ELIMINATED][ np.random.randint( len(CHARASTIC_SETS[VAR_ELIMINATED]) ) ];
    INDEX_i = CHARASTIC_SETS[VAR_ELIMINATED].index(POLYNOMIAL_WUBAS);INDEX_j = CHARASTIC_SETS[VAR_ELIMINATED].index(POLYNOMIAL_DIV);
    while (VAR_ELIMINATED,(INDEX_i,INDEX_j)) in VISITED_POINTS:
        if VAR_ELIMINATED==VAR_ELIMINATED_START:POLYNOMIAL_WUBAS = CHARASTIC_SETS[VAR_ELIMINATED][ np.random.randint( len(CHARASTIC_SETS[VAR_ELIMINATED]) ) ];
        POLYNOMIAL_DIV   = CHARASTIC_SETS[VAR_ELIMINATED][ np.random.randint( len(CHARASTIC_SETS[VAR_ELIMINATED]) ) ];
        while POLYNOMIAL_DIV == POLYNOMIAL_WUBAS:POLYNOMIAL_DIV = CHARASTIC_SETS[VAR_ELIMINATED][ np.random.randint( len(CHARASTIC_SETS[VAR_ELIMINATED]) ) ];
        INDEX_i = CHARASTIC_SETS[VAR_ELIMINATED].index(POLYNOMIAL_WUBAS);INDEX_j = CHARASTIC_SETS[VAR_ELIMINATED].index(POLYNOMIAL_DIV);
        RUNNING_TIMES_VIS+=1;
        if RUNNING_TIMES_VIS>2000:
            NEED_TO_BACKT = True;RUNNING_TIMES_VIS=0;break;
    if NEED_TO_BACKT:
        NEED_TO_BACKT = False;
        VAR_ELIMINATED_START = ITEMS_VARS_USED[ ITEMS_VARS_USED.index(VAR_ELIMINATED_START) +1];
        VAR_ELIMINATED = VAR_ELIMINATED_START;continue;        
    CHARSET_NUM_RECORD[ITEMS_VARS_USED[INDEX_VAR+1]].append( len(CHARASTIC_SETS[ITEMS_VARS_USED[INDEX_VAR+1]]) );
    VISITED_POINTS.append( (VAR_ELIMINATED,(INDEX_i,INDEX_j)) );
    # --- Doing reduction on x_n ---
    POLYNOMIAL_QUO,POLYNOMIAL_REM = pseudo_division(POLYNOMIAL_WUBAS,POLYNOMIAL_DIV,VAR_ELIMINATED);
    if POLYNOMIAL_REM==0 or (POLYNOMIAL_REM in CHARASTIC_SETS[ITEMS_VARS_USED[INDEX_VAR+1]]):
        VAR_ELIMINATED = VAR_ELIMINATED_START;continue; # back-tracing;
    CHARASTIC_SETS[ITEMS_VARS_USED[INDEX_VAR+1]].append(POLYNOMIAL_REM);
    VAR_ELIMINATED = ITEMS_VARS_USED[INDEX_VAR+1];
    POLYNOMIAL_WUBAS = POLYNOMIAL_REM;
    RUNNING_TIMES+=1;print('Running --- '+str(RUNNING_TIMES));
    if VAR_ELIMINATED==ITEMS_VARS_USED[-1]:print(POLYNOMIAL_REM);

其实我们如上代码采用的是以深度优先为主,实时探测消元进行位置的思路,当消元过程已经迈过了消元特征方程数量的峰值区域后,方程数量急剧减少,这时就更容易得到 $0$ 多项式,这时我们就需要调整搜索起始位置,适当地进行广度优先的策略,这样更容易得到严格特征列,以下是对 $m = 16, n = 8$ 的MQ方程组运行的结果,成功解出了方程:

 ============  t1  ================= 
R_m = 16
R_m+1 = 0
Running --- 1
 ============  t2  ================= 
R_m = 1
R_m+1 = 0
 ============  t1  ================= 
R_m = 16
R_m+1 = 1
Running --- 2
 ============  t2  ================= 
R_m = 2
R_m+1 = 0
Running --- 3
 ============  t3  ================= 
R_m = 1
R_m+1 = 0
 ============  t1  ================= 
R_m = 16
R_m+1 = 2
Running --- 4
 ============  t2  ================= 
R_m = 3
R_m+1 = 1
Running --- 5
 ============  t3  ================= 
R_m = 2
R_m+1 = 0
Running --- 6
 ============  t4  ================= 
R_m = 1
R_m+1 = 0
 ============  t1  ================= 
R_m = 16
R_m+1 = 3
... ... 

... ...
============  t5  ================= 
R_m = 533
R_m+1 = 41
... ...
 ============  t5  ================= 
R_m = 533
R_m+1 = 41
Running --- 13272
 ============  t6  ================= 
R_m = 42
R_m+1 = 5
Running --- 13273
 ============  t7  ================= 
R_m = 6
R_m+1 = 0
Running --- 13274
f_n = t8 + 1;

其中变元消元项序为 $t_1,...,t_8$ , $\mathcal{R}_m$ 代表当前变元对应特征多项式 $f_m$ (非0的)的数量, $\mathcal{R}_{m+1}$ 代表当前变元对应特征多项式 $f_{m+1}$ (非0的)的数量;最终得到 $f_n = t_8+1=0$ ,也就解出了 $t_8 = 1$ ,再逐次代入之前的方程就可以解出全部解(根据零点定理这就是原方程组(问题里它是 $0$ 维理想)对应的簇);