python—二次规划求解

最新推荐文章于 2024-06-19 17:47:39 发布

erdaidai

最新推荐文章于 2024-06-19 17:47:39 发布

阅读量3.8k

点赞数 4

分类专栏： python 机器学习

本文链接：https://blog.csdn.net/erdaidai/article/details/111661747

版权

机器学习同时被 2 个专栏收录

12 篇文章 1 订阅

订阅专栏

python

11 篇文章 0 订阅

订阅专栏

python—二次规划求解

一般步骤
引例
SVDD求解
- 单分类
- 二分类
代码分析

一般步骤

将一般形式的待求解目标函数化成标准形式。
标准形式如下：

$\begin{cases} \min \limits_{x} = \frac{1}{2}x^{T}Px + q^{T}x \\ s.t. \ \ \ \ Gx \leq h \\ Ax = b \end{cases}$

带入cvxopt包中的solvers方法求解

引例

【例】求如下的二次规划问题
$\min \limits_{x}f(x) = \frac{1}{2}x_{1}^{2} + x_{2}^{2} -x_{1}x_{2} -2x_{1} - 6x_{2},s.t.\ \begin{cases} x_{1} + x_{2} \leq 2\\ -x_{1} + 2x_{2} \leq 2\\ 2x_{1} + x_{2}\leq3\\ x_{1}, x_{2} \geq 0 \end{cases}$
首先，我们将上式化成标准形式。
向量 $\boldsymbol{x}$ 很容易写出来，因为 $f (x)$ 包含两个变量 $x_{1}$ , $x_{2}$ ，因此
$\begin{bmatrix} x_{1} \\ x_{2} \end{bmatrix}$
向量 $q$ 只与两个变量 $x_{1}$ ， $x_{2}$ 的一次项有关，所以 $q^T \boldsymbol{x} = -2x_{1} - 6x_{2}$ ，因此
$\begin{bmatrix} -2 \\ -6 \end{bmatrix}$
最后，矩阵 $P$ 只与两个变量 $x_{1}$ ， $x_{2}$ 的二次项有关，所以 $\frac{1}{2}x^TPx = \frac{1}{2}x_{1}^2 + x_{2}^2 - x_{1}x_{2}$ ，这里要注意的是不同于二次型，这里有个系数 $\frac{1}{2}$ ，所以矩阵 $P$ 的元素是二次型中的矩阵元素大小的两倍。给出一个规律：设矩阵 $P$ 第 $i$ 行第 $j$ 列的元素大小为 $P (i, j)$ ，二次项 $x_{i}, y_{j}$ 的系数为 $a (i, j)$ ，
$\begin{cases} 2a(i, j), i = j \\ a(i, j), i \neq j \end{cases}$
本例中， $\begin{bmatrix} 1 &-2\\ -2&2 \end{bmatrix}$ ，这是由于 $x_{1}$ 的平方项（即 $x_{1}^2$ ），所以第1行的第1列的元素为 $2*(\frac{1}{2})$ ， $x_{2}$ 的平方项（即 $x_{2}^2$ ）系数为1，所以第2行第2列的元素为 $2 = 2 * 1$ ， $x_{1}x_{2}$ 即（ $x_{2}x_{1}$ ）的系数为-1，所以第1行第2列和第2行第1列的元素均为-2。

再看约束条件部分，约束条件应该写成以下标准形式：
$\begin{cases} Gx \leq h \\ Ax = b \end{cases}$

本例中约束条件只有不等式约束，因此 $\emptyset$ ，对于 $G$ 和 $h$ 很容易就看得出来：
$\begin{bmatrix} 1 & 1\\ -1 & 2\\ 2 & 1\\ -1 & 0\\ 0 & -1 \end{bmatrix}, h = \begin{bmatrix} 2\\ 2\\ 3\\ 0\\ 0 \end{bmatrix}$
注意，当 $\leq 0$ 时，乘以一个 $- 1$ ，变成 $\geq 0$ 。

python 代码求解：1）要是约束条件中有的没有，则不输入给qb函数即可，比如此例子中的A,b。2）输入必须是float类型，所以用tc=‘d’，转一下数据类型。

def sqp(paraP, paraq, paraG, parah):
    P = matrix(np.array(paraP), tc='d')
    q = matrix(np.array(paraq), tc='d')
    G = matrix(np.array(paraG), tc='d')
    h = matrix(np.array(parah), tc='d')
    # A = matrix(np.array(paraA), tc='d')
    # b = matrix(np.array(parab), tc='d')
    result = solvers.qp(P, q, G, h)

    print('x\n', result['x'])

P = [[1, -1], [-1, 2]]
q = [-2, 6]
G = [[1, 1], [-1, 2], [2, 1], [-1, 0], [0, -1]]
h = [2, 2, 3, 0, 0]

sqp(P, q, G, h)

求解结果：
在这里插入图片描述

SVDD求解

SVDD原理是在特征空间寻找一个体积最小的超球体，为了构造这样一个最小体积的超球体，SVDD需要解决以下优化问题：
$\begin{cases} \min \limits_{x, R, \xi} R^2 + C\sum\limits_{i = 1}^n\xi_{i} \\ s.t. \ \ \ \ ||\phi(x_{i}) - a ||^2 \leq R + \xi_{i}, \xi_{i} \geq 0, \forall i = 1, 2, \cdots , n \end{cases}$
式中， $R$ 是超球体半径， $a$ 是超球体的球心， $\xi$ 是松弛因子， $C$ 是一个权衡超球体体积和误分率的惩罚参数， $C$ 大，则表示惩罚越大，为了使目标函数最小，则 $\xi$ 变小，同时 $R$ 变大。相反， $C$ 越小， $R$ 越小。

单分类

对于单分类来说，结合拉格朗日乘子法（具体过程详见参考文献），原问题的对偶问题为：
$\begin{cases} \min \limits_{\alpha_{i}}\sum\limits_{i=1}^n\sum\limits_{j=1}^n\alpha_{i}\alpha_{j} K(x_{i}, x_{j}) - \sum\limits_{i = 1}^n\alpha_{i}K(x_{i}, x_{j})\\ s.t. \ \ \ \ 0 \leq \alpha_{i} \leq C, \ \ \sum\limits_{i =1}^n\alpha_{i} = 1 \end{cases}$

把所有的 $\alpha_{i}, \alpha_{j}$ 看成是一个向量 $\boldsymbol{\alpha}$ ，根据二次规划的标准形式可以得到：
$2\sum\limits_{i = 1}^n\sum\limits_{j = 1}^nK(x_{i}, x_{j}),\ q =(-\sum\limits_{i =1}^nK(x_{i}, x_{i}))^T\\ G = \begin{bmatrix} 1 & 0 &0 &\cdots &0\\ 0 & 1& 0&\cdots &0\\ \vdots & \ddots& \ddots&\ddots & \vdots\\ 0 & 0& 0&\cdots &1\\ -1 & 0 &0 &\cdots &0\\ 0 & -1& 0&\cdots &0\\ \vdots & \ddots& \ddots&\ddots & \vdots\\ 0 & 0& 0&\cdots &-1 \end{bmatrix}, \ h = \begin{bmatrix} C \\ \vdots\\ C\\ 0\\ \vdots\\ 0\end{bmatrix}\\ A = \begin{bmatrix} 1 & 1& \cdots &1 \end{bmatrix} \ b =1$
设样本总数是 $n$ ，其中 $G$ 大小是 $2 n * n$ ， $h$ 的大小是 $2 n * 1$ ， $A$ 的大小是 $1 * n$ ， $b$ 的大小时1。

二分类

对于二分类，在正类训练集中加入了少数的负类样本来防止过拟合情况，假设正样例和负样例的标签分别是 $y_{i} = +1$ 和 $y_{j} = -1$ ，则原优化问题的对偶问题变为：
$\begin{cases} \min \limits_{\alpha_{i}}\sum\limits_{i=1}^n\sum\limits_{j=1}^n y_{i}y_{j} \alpha_{i}\alpha_{j} K(x_{i}, x_{j}) - \sum\limits_{i = 1}^ny_{i}\alpha_{i}K(x_{i}, x_{j})\\ s.t. \ \ \ \ 0 \leq \alpha_{i} \leq C_{1}, \ 0 \leq \alpha_{i} \leq C_{2}, \ \ \sum\limits_{i =1}^ny_{i}\alpha_{i} = 1 \end{cases}$
两类比一类会多一个 $y$ ，此时可以的到：
$2\sum\limits_{i = 1}^n\sum\limits_{j = 1}^n y_{i} y_{j}K(x_{i}, x_{j}),\ q =(-\sum\limits_{i =1}^ny_{i}K(x_{i}, x_{i}))^T\\ G = \begin{bmatrix} 1 & 0 &0 &\cdots &0\\ 0 & 1& 0&\cdots &0\\ \vdots & \ddots& \ddots&\ddots & \vdots\\ 0 & 0& 0&\cdots &1\\ -1 & 0 &0 &\cdots &0\\ 0 & -1& 0&\cdots &0\\ \vdots & \ddots& \ddots&\ddots & \vdots\\ 0 & 0& 0&\cdots &-1 \end{bmatrix}, \ h = \begin{bmatrix}C_{1} \\ \vdots\\ C_{2} \\ \vdots\\ 0\end{bmatrix}\\ A = \begin{bmatrix} y_{1}, y_{2}, \cdots, y_{n} \end{bmatrix}, \ b =1$
与单分类不同的是 $h$ 的前 $n$ 部分的 $C$ 是对应于正负样本的 $C_{1}, C_{2}$ ，总大小和单分类一样为 $2 n * 1$ 。 $A$ 等于标签的值。

代码分析

        label = np.mat(label)
        K = np.multiply(label*label.T, K)
        
        # P
        n = K.shape[0]
        P = K+K.T
        
        # q
        q = -np.multiply(label, np.mat(np.diagonal(K)).T)

        # G
        G1 = -np.eye(n)
        G2 = np.eye(n)
        G = np.append(G1, G2, axis=0)
        
        # h
        h1 = np.mat(np.zeros(n)).T # lb
        h2 = np.mat(np.ones(n)).T
        if self.labeltype == 'single':
            h2[label == 1] = self.parameters["positive penalty"]
        
        if self.labeltype == 'hybrid':
            h2[label == 1] = self.parameters["positive penalty"]
            h2[label == -1] = self.parameters["negative penalty"]

            
        h = np.append(h1, h2, axis=0)
        
        # A, b
        A = np.mat(np.ones(n) * np.array(label).reshape(1, n))
        #A = np.mat(np.ones(n))
        b = 1.
        
        #
        P = matrix(P)
        q = matrix(q)
        G = matrix(G)
        h = matrix(h)
        A = matrix(A)
        b = matrix(b)
        
        #
        sol =solvers.qp(P, q, G, h, A, b)
        alf = np.array(sol['x'])
        print(alf)

在这里插入图片描述