运筹学的第一课：单纯形法

最新推荐文章于 2023-11-28 23:16:27 发布

ordinary_brony

最新推荐文章于 2023-11-28 23:16:27 发布

阅读量7.8k

点赞数 30

分类专栏：研究生课堂学习笔记文章标签：算法经验分享其他

本文链接：https://blog.csdn.net/ordinary_brony/article/details/112102569

版权

研究生课堂学习笔记专栏收录该内容

4 篇文章 1 订阅

订阅专栏

导读

运筹学第一课会给你讲线性规划，也就是从初中以来我们拿多元一次方程组做的“旅游叫车问题”、“投资问题”等等。相信在这个时候，每个人的第一印象是：我感觉我行了。然后老师就开始讲单纯形法。从那时候起，理智直接归零，再也没恢复，于是便带着满脑子问号开始了除了上课以外的其他任何事情。

这里就简单梳理一下单纯形法的概念和步骤。

单纯形法简介

单纯形法是求解线性规划问题最常用、最有效的算法之一。单纯形法最早由 George Dantzig于1947年提出，近70年来，虽有许多变形体已经开发，但却保持着同样的基本观念。如果线性规划问题的最优解存在，则一定可以在其可行区域的顶点中找到。基于此，单纯形法的基本思路是：先找出可行域的一个顶点，据一定规则判断其是否最优；若否，则转换到与之相邻的另一顶点，并使目标函数值更优；如此下去，直到找到某最优解为止。

——摘自百度百科【单纯形法】

简单地说，单纯形法就是解决线性规划的另一种选择。毕竟，我们既然在大学的线性代数里面学习了多元一次方程和增广矩阵，那么单纯形法就单纯的是用大学生的方法解决初中生的问题。那这个锅老师就不该背了，感觉难实际上是工具难用。

单纯形法的步骤简介

题目一开始会给定约束方程，比如说：

$\left\{\begin{matrix} 5x_1&+&6x_2&\le&10\\ 3x_1&-&2x_2&\ge&6\\ x_1&,&x_2&\ge&0 \end{matrix}\right.$

然后就让你求目标函数的最优解，就假设是：

$z_{max}=9x_1+8x_2$

如果单纯使用线性规划做，两个未知数的情况下是可以做的。但是四个呢？十个呢？这些就没有办法了。

而矩阵就是高维的抽象表达，可以参考我之前写的多元函数的梯度下降。所以，这里就用我们大学里面最熟悉的增广矩阵来解决这些非线性的多元一次方程组。

但是直接做肯定是不可以的，因为使用条件是方程组，这就规定了必须得是等式。所以，人为的添加变量：

$\left\{\begin{matrix} 5x_1&+6x_2&+x_3&&=&10\\ 3x_1&-2x_2&&-x_4&=&6\\ x_1,&x_2,&x_3,&x_4&\ge&0 \end{matrix}\right.$

虽然第三个式子依然是不等式，但是这个没什么影响。我们可以不考虑第三个不等式然后求出所有的解，最后根据第三个不等式筛选出全都是正数的解就好了。

于是，整个方程组就剩下：

$\left\{\begin{matrix} 5x_1&+6x_2&+x_3&&=&10\\ 3x_1&-2x_2&&-x_4&=&6 \end{matrix}\right.$

我们做出增广矩阵

$\left[\begin{matrix} 5&6&1&0&10\\3&-2&0&-1&6 \end{matrix}\right]$

但是我们的目标是找出最优，而不是求出解。所以再加上一些行列：

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_3$
$x_4$
$\lambda_j$

突然蒙圈了？没有关系，看看下面的说明

单纯形法的一些说明

简介不需要明白太多，毕竟几十年前的东西了。这里就直接开始说明矩阵的构成。

由于市面上不同的书有着不同的版本，我这里就选择西安邮电大学史新峰老师的教学视频里使用的矩阵格式进行说明，因为这个矩阵是我认为最简洁最好懂的。

另外说明一点：我会把需要说明的部分高亮标记，但是这并不代表文字对应的意义，而应当是表格的该位置对应的意义。

决策变量

以下表格中标红的便是决策变量

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_3$
$x_4$
$\lambda_j$

基变量

下面这个表格中标蓝的是基变量

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_3$
$x_4$
$\lambda_j$

工艺常数

下面这个矩阵中标绿了的地方就是工艺常数。

	$x_1$	$x_2$	$x_3$	$x_4$
$x_3$	$5$	$6$	$1$	$0$
$x_4$	$3$	$- 2$	$0$	$- 1$
$\lambda_j$

右端常数

下面这张表中标记为冷铜色的地方就是右端常数

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_3$					$10$
$x_4$					$6$
$\lambda_j$

空白处

下面表格中使用 $\Phi$ 填充的格子中，并没有可以填的数据，所以一般都空着。

	$b$	$\theta$
$x_3$
$x_4$
$\lambda_j$	$\Phi$	$\Phi$

$\theta$

下面表格中标紫了的地方就是 $\theta$

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_3$						$2$
$x_4$						$2$
$\lambda_j$

检验数

下面表格中标蓝了的地方就是检验数

	$x_1$	$x_2$	$x_3$	$x_4$
$x_3$
$x_4$
$\lambda_j$	$9$	$8$	$0$	$0$

其实这一行是人工添加的，就像是特征工程里面会人工添加特征让数据更清晰一样。这里原本应当填入的数据是我们的目标函数。我们一开始拿到的目标方程是 $z_{max}=9x_1+8x_2$ ，那么就应当是填成表格上所显示的那样。

把其中的一些部分组合起来

到这里，表格的每个部分代表什么意思都已经介绍完了。接下来，一些特定部分组合起来也有特殊的意义。

约束方程

在这里其实约束方程并不是一开始题目所给的不等式方程组，而是我们人工添加变量后拿到的等式方程组。

也就是工艺常数部分加上右端常数部分。

	$x_1$	$x_2$	$x_3$	$x_4$	$b$
$x_3$	$5$	$6$	$1$	$0$	$10$
$x_4$	$3$	$- 2$	$0$	$- 1$	$6$
$\lambda_j$

典则形式

是约束方程部分加上检验数部分，也就是工艺常数、右端常数以及检验数。

	$x_1$	$x_2$	$x_3$	$x_4$	$b$
$x_3$	$5$	$6$	$1$	$0$	$10$
$x_4$	$3$	$- 2$	$0$	$- 1$	$6$
$\lambda_j$	$9$	$8$	$0$	$0$

计算步骤

好了，全部介绍完了，接下来就是真正的计算了。

类似我们刚刚举例的“典则形式”应该是没有什么问题了吧？先完善一个增广矩阵，接着再根据目标函数把下面的检验数补齐。这都没什么问题。问题在下面的寻找最优。

判断条件（一）

什么时候我们拿到了最优解？那就是检测数没有正数的时候。我们可以看到现在的典则形式还有 $9$ 和 $8$ 两个正数，所以现在显然不是最优解。

出基和进基

既然不是最优解，那么我们就根据出基和入基的规则进行判断。首先，我们选择检测数最大的一个，也就是 $9$ ，即 $x_1$ 列。接着我们用 $x_1$ 列的数字根据行对应分别除以右端常数，bin并将得出来的数字一一根据行对应填在 $\theta$ 列内，得：

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_3$	$5$	$6$	$1$	$0$	$10$	$2$
$x_4$	$3$	$- 2$	$0$	$- 1$	$6$	$2$
$\lambda_j$	$9$	$8$	$0$	$0$	$\Phi$	$\Phi$

接着我们再从 $\theta$ 列中选择一个最小的（由于这里都是 $2$ ，所以我选择 $x_3$ 行），也就是 $x_3$ 。于是， $x_1$ 就成为了基变量，叫进基； $x_3$ 就不再是基变量，叫出基。

于是矩阵稍微改写（将基变量部分中的 $x_3$ 改为 $x_1$ ）：

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_1$	$5$	$6$	$1$	$0$	$10$	$2$
$x_4$	$3$	$- 2$	$0$	$- 1$	$6$	$2$
$\lambda_j$	$9$	$8$	$0$	$0$	$\Phi$	$\Phi$

矩阵变换

线性代数告诉我们：在研究高维度的时候，如果有几个相互垂直的单位向量，那么一定会这么写：

	$e_1$	$e_2$	$\cdots$	$e_n$
$e_1$	$1$	$0$	$\cdots$	$0$
$e_2$	$0$	$1$	$\cdots$	$0$
$\vdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
$e_n$	$0$	$0$	$\cdots$	$1$

所以，如果 $x_1$ 作为基变量，那么我们刚刚确认的 $x_1$ 列和 $x_3$ 行交界处应当通过初等行变换改成 $1$ ，同时 $x_1$ 列其余所有位置应当改为 $0$ 。别忘了，初等行变换是只能行与行之间进行加减乘除，列与列之间的任何变换都是不允许的。当然，像右下角两个本来就没有值的地方不需要变换，因为没有任何意义。

这个中间计算步骤我们就省略了，直接看我们第一次执行的结果：

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_1$	$1$	$6\over5$	$1\over5$	$0$	$2$	需刷新
$x_4$	$0$	$-\frac{28}{5}$	$-\frac{3}{5}$	$- 1$	$0$	需刷新
$\lambda_j$	$0$	$-\frac{14}{5}$	$-\frac{9}{5}$	$0$	$\Phi$	$\Phi$

判断条件（二）

如何判断计算是否结束了？那就是最后的 $\lambda$ 行是不是没有正数了。我们现在看到确实没有正数了，但是这样直接算还是太麻烦了。所以，强行继续，再来第二次：

	$x_1$	$x_2$	$x_3$	$x_4$	$b$	$\theta$
$x_1$	$1$	$0$	$1\over14$	$-\frac{3}{14}$	$2$	$5\over3$
$x_2$	$0$	$1$	$3\over28$	$\frac{5}{28}$	$0$	$0$
$\lambda_j$	$0$	$0$	$-\frac{3}{2}$	$1\over2$	$\Phi$	$\Phi$

有些版本中的矩阵会看起来更复杂，实际上有这些就够了。

写出结果

我们这个时候基本上就可以认定：

$\left\{\begin{matrix} x_1=2\\x_2=0 \end{matrix}\right.$

最终，我们所需要求的最大结果就是：

$z_{max}=9x_1+8x_2=18$

总结

看出来了吗？最核心的几点就是：

首先根据题目所给的条件填入矩阵中；
其次选择最大的 $\lambda$ ，根据这一列和右端常数计算出 $\theta$ ，接着选出最小的 $\theta$ （可以横竖各画一道杠，做个标记），最后该行所代表的基变量出基、该列所代表的决策变量进基；
将做标记的列化成单位列向量，要求是交点处为 $1$ 而其他位置是 $0$ ；
$\lambda$ 列有正数吗？有还要继续，基变量部分如果还存在人为添加的辅助变量也要继续，即没有正数又没人工变量就可以结束了
最后，把此时的右端常数当作结果抄下来。

这就是运筹学的单纯形法。是不是有点能理解了呢？

ordinary_brony

关注

30
点赞
踩
92

收藏

觉得还不错? 一键收藏
打赏
2
评论
运筹学的第一课：单纯形法

运筹学第一课会给你讲线性规划，也就是从初中以来我们拿多元一次方程组做的“旅游叫车问题”、“投资问题”等等。相信在这个时候，每个人的第一印象是：我感觉我行了。然后老师就开始讲单纯形法。从那时候起，理智直接归零，再也没恢复，于是便带着满脑子问号开始了除了上课以外的其他任何事情。这里就帮大家简单梳理一下单纯形法的概念和步骤。
复制链接

扫一扫