形式化10：线性算术理论

最新推荐文章于 2024-08-09 21:30:00 发布

廊桥晚钟

最新推荐文章于 2024-08-09 21:30:00 发布

阅读量690

点赞数

分类专栏：形式化方法文章标签：线性算术理论傅里叶-莫茨金消元法单纯形法编译器优化 N皇后问题

本文链接：https://blog.csdn.net/weixin_47539430/article/details/125849612

版权

形式化方法专栏收录该内容

13 篇文章 7 订阅

订阅专栏

线性算术理论

语法

A-原子要素 E-表达式 R-关系式 P-命题

$\begin{align} A::=&x|c|c\times x\ (变量集合\quad 常量集合 \quad常量\times变量)\\ E::=&A|A+E\ (减法可以转换为加法) \\ R::=&E=E|E<=E|E<E \\ P::=&R \\ |&P \land P \end{align}$

例如（示例中的{相当于/\）

$\begin{cases} x+y=0.8 \\ x-y=0.2 \end{cases} \Longrightarrow \begin{cases} x+y=0.8 \\ x+(-1)*y=0.2 \end{cases}$

# Z3 code: 
x, y = Reals(‘x y’)
solve(x+y == 0.8, x-y == 0.2)

解决线性算术理论的算法

傅里叶-莫茨金消元法（Fourier-Motzkin variable elimination）

将线性算术进行标准化，寻找某一个变量 $x_i$ ，使其仅出现正负值，且不等式右边都为 $\ge 0$ 的形式

$\begin{cases} x_i+P_1(x) &\ge 0 \quad &(p_1)\\ ......\\ x_i+P_m(x) &\ge 0 \quad &(p_m)\\ -x_i+Q_1(x) &\ge 0 \quad &(q_1)\\ ......\\ -x_i+Q_n(x) &\ge 0 \quad &(q_n)\\ R(x) &\ge 0 \quad &(r_1) \end{cases}$

其中 $P_?(x),Q_?(x),R(x)$ 中都不含有变量 $x_i$ 。

进行消元，将公式 $p_1$ 与 $q_1$ 到 $q_n$ 分别相加，消去 $x_i$ ，可得到n个不等式
将 $p_2$ 到 $p_m$ 执行和第二步相同的操作，共可得到 $m\times n$ 个不等式

$\begin{cases} P_1(x) + Q_1(x) &\ge 0\\ ......\\ P_1(x) + Q_n(x) &\ge 0\\ P_2(x) + Q_1(x) &\ge 0\\ ......\\ P_2(x) + Q_n(x) &\ge 0\\ ......\\ P_m(x) + Q_1(x) &\ge 0\\ ......\\ P_m(x) + Q_n(x) &\ge 0\\ R(x) &\ge 0 \end{cases}$

回到第一步，继续消除下一个变量
如果线性不等式中的所有变量都被消除，那么我们会得到一个常不等式。如果常不等式为真，那么原不等式有解，否则无解

例如
在这里插入图片描述

此算法时间复杂度很高

单纯形法（Simplex）

将不等式转化为标准范式
$\begin{cases} P_1(x) \ge c_1 \\ ...... \\ P_n(x) \ge c_n \end{cases} \xRightarrow{令P_i(x)=s_i} \begin{cases} P_1(x) - s_1 = 0\\ ...... \\ P_n(x) - s_n = 0 \\ s_1 \ge c_1 \\ ......\\ s_n \ge c_n \end{cases}$

其中x称为基本变量，s称为额外变量。
例如：
$\begin{cases} x+y \ge 2 \\ 2x-y \ge 0 \\ -x+2y \ge 1 \end{cases} \to \begin{cases} x+y-s1=0 \\ 2x-y-s2=0 \\ -x+2y-s3=0 \\ s1 \ge 2 \\ s2 \ge 0 \\ s3 \ge 1 \end{cases}$

构建单纯形表

	x	y
s1	1	1
s2	2	-1
s1	-1	2

其中需满足：

$\begin{cases} s1 \ge 2 \\ s2 \ge 0 \\ s3 \ge 1 \end{cases}$

尝试并修正（Trial and Fix）
对x和y选取任意值进行尝试，然后通过单纯形表的变换进行修正，具体如下：

令 $x = y = 0$ ，可得：
$\to \textcolor{red}{s1=0},s2=0,\textcolor{red}{s3=0}$
其中明显的红色部分不满足要求，需要对其进行修正
首先修正 $s 1$ ：通过移项将某个基础变量由 $s 1$ 进行表示
$\to x=s1-y$
然后将 $s 2, s 3$ 中的 $x$ 替换为 $s 1$

$\begin{align} &s2=2x-y=2(s1-y)-y=2s1-3y\\ &s3=-x+2y=-(s1-y)+2y=-s1+3y \end{align}$

更新单纯形表

	s1	y
x	1	-1
s2	2	-3
s3	-1	3

继续尝试，由于此次 $s 1$ 有明确范围，可以将 $s 1$ 恰好取在边界处（注意，不再是假设 $x, y$ 的值，而是 $s 1, y$ ）
$\to x=2,s2=4,\textcolor{red}{s3=-2}$
其中明显的红色部分不满足要求，需要对其进行修正（ $x$ 取任意值都可以）
修正 $s 3$ ：通过移项将单纯形表上方的某个基础变量由 $s 3$ 进行表示（显然只有 $y$ ）
$\to y=\frac{s1+s3}{3}$
然后将 $x, s 2$ 中的 $y$ 替换为 $s 3$

$\begin{align} &x=s1-y=s1-\frac{s1+s3}{3}=\frac{2s1-s3}{3} \\ &s2=2s1-3y=2s1-3(\frac{s1+s3}{3})=s1-s3 \end{align}$

更新单纯形表

	s1	s2
x	$\frac{2}{3}$	$-\frac{1}{3}$
s2	$1$	$- 1$
s3	$\frac{1}{3}$	$\frac{1}{3}$

继续尝试，由于 $s 1, s 3$ 都有明确范围，因此直接取边界值
$\to x=1,s2=1,y=1$
条件全部满足，这样就得到了一组可行的模型（model） $[x = 1, y = 1]$

分支定界法（Branch and Bound）

分支定界法应用在ILP问题中，类似于LP（Linear Problem）但是将问题限制在了整数域中。例如

$\begin{cases} x+y &\ge 2 \\ 2x-y &\ge 0 \\ -x+2y &\ge 1 \end{cases} (x,y \in \mathbb{Z})$

问题的求解可以利用分治法：

首先解决 $\in \mathbb{R}$ 上的解(利用单纯形法)
如果无解，那么此问题UNSAT
如果有解 $[x = r 0, y = r 1]$ ，
- 如果 $\in \mathbb{Z}$ ，则SAT
- 否则建立分支： $(1)\ S\cup [x \ge \lceil c0 \rceil] \quad (2)S\cup [x \le \lfloor c0 \rfloor]$
  例如 $[x = 1.7, y = 3.5]$ ，那么分支后变为
$\begin{cases} x+y &\ge 2 \\ 2x-y &\ge 0 \\ -x+2y &\ge 1 \\ x &\ge 2 \end{cases} \quad 和 \quad \begin{cases} x+y &\ge 2 \\ 2x-y &\ge 0 \\ -x+2y &\ge 1 \\ x &\le 1 \end{cases}$
对于以上两个分支递归求解，直到SAT或UNSAT

线性运算的应用

编译器优化

for (int i = 1; i < 10; ++i) {
    A[j + i] = A[j];
}

在上面的代码中可以看到A[j]是不变的，因此可以采用循环变量外提（Loop invariant hoisting）的操作优化代码的执行效率

int t = A[j];
for (int i = 1; i < 10; ++i) {
    A[j + i] = t;
}

编译器通常会执行这样的优化，但是在此之前，编译器必须检查 $\land i<10 \land j+i=j$ 这个命题是UNSAT的，即保证内存没有交叠。

N皇后问题

对系统建立数学模型，设棋盘为N阶矩阵：int board[n][n]，
- $b o a r d [i] [j] = 1$ ：这个格子有皇后
- $b o a r d [i] [j] = 0$ ：这个格子没有皇后
每行存在一个皇后：遍历所有的 $i$ （即遍历每一行）需满足 $\sum_{\substack{j}}board[i][j]=1$
每列存在一个皇后：遍历所有的 $j$ （即遍历每一列）需满足 $\sum_{\substack{i}}board[i][j]=1$
每条对角线最多有一个皇后
每条反对角线最多有一个皇后

用z3实现的代码如下

def n_queen_la(board_size: int):
    solver = Solver()
    n = board_size

    # Each position of the board is represented by a 0-1 integer variable:
    #   ...    ...    ...    ...
    #   x_2_0  x_2_1  x_2_2  ...
    #   x_1_0  x_1_1  x_1_2  ...
    #   x_0_0  x_0_1  x_0_2  ...
    #
    board = [[Int(f"x_{row}_{col}") for col in range(n)] for row in range(n)]

    # only be 0 or 1 in board
    for row in board:
        for pos in row:
            solver.add(Or(pos == 0, pos == 1))

    # @exercise 11: please fill in the missing code to add
    # the following constraint into the solver:
    #   each row has just 1 queen,
    #   each column has just 1 queen,
    #   each diagonal has at most 1 queen,
    #   each anti-diagonal has at most 1 queen.
    # raise Todo("exercise 11: please fill in the missing code.")
    for i in range(n):
        arr = []
        for j in range(n):
            arr.append(board[i][j])
        solver.add(sum(arr) == 1)

    for j in range(n):
        arr = []
        for i in range(n):
            arr.append(board[i][j])
        solver.add(sum(arr) == 1)

    # 主对角线
    # 从(0,i)出发遍历主对角线
    for i in range(n):
        arr = []
        for j in range(n):
            if j + i < n:
                print(f"[{j},{j + i}]")
                arr.append(board[j][j + i])
        print()
        solver.add(sum(arr) <= 1)

    # 从(i,0)出发遍历主对角线
    for i in range(1, n):
        arr = []
        for j in range(n):
            if j + i < n:
                print(f"[{j + i},{j}]")
                arr.append(board[j + i][j])
        solver.add(sum(arr) <= 1)

    # 副对角线
    # 从(i,0)开始遍历副对角线
    # 则副对角线的所有点满足：横纵坐标和为i
    for i in range(n):
        arr = []
        for j in range(i + 1):
            arr.append(board[i - j][j])
        solver.add(sum(arr) <= 1)

    # 从(i,n-1)开始遍历副对角线
    # 则副对角线的所有点满足：横纵坐标和为i+n-1
    for i in range(1, n):
        arr = []
        for j in range(n):
            row = i + n - 1 - j
            if row < n:
                arr.append(board[row][j])
        solver.add(sum(arr) <= 1)

    return solver.check()

子集求和问题

在一个集合 $S=\{x_1,x_2,...,x_n\}$ 中，是否存在一个子集 $\subseteq S$ ，使得子集中所有的和满足 $\sum T=0$

建立数学模型，设int select[n]
- select[i]=1： $x_{i+1}$ 被选中
- select[i]=0： $x_{i+1}$ 未被选中
描述约束： $\sum_{\substack{i}}select[i]\times S[i]=0$

任务调度问题

有n个任务，给定其启动时间和结束时间，如何安排这些任务可以获得最多的任务执行数
$\begin{align} S=\{s1,...,sn\} \\ F=\{f1,...,fn\} \end{align}$

数学建模，设int select[n]表示是否选定某个任务, times[i][j]表示任务i是否在时刻j中需要执行
设定约束条件
- $\times times[i][j]$ , 例如如果没有选择任务1, 那么第1行就会被清零
- $\sum_{\substack{i}}board[i][j]\le 1$ ,即同一时刻最多只能执行一项任务(每一列相加不超过1)
设定目标： $max(\sum_{\substack{i}}select[i])$ 。