【机器学习】Weighted LSSVM原理与Python实现：LSSVM的稀疏化改进

最新推荐文章于 2024-07-25 15:32:55 发布

Luqiang_Shi

最新推荐文章于 2024-07-25 15:32:55 发布

阅读量7.6k

点赞数 8

分类专栏：机器学习人工智能稀疏化 WLSSVM LSSVM 文章标签： WLSSVM 稀疏化 LSSVM LSSVM回归模型机器学习

本文链接：https://blog.csdn.net/luqiang_shi/article/details/84402375

版权

本文介绍了LSSVM回归模型的原理及其在预测中的应用，探讨了LSSVM的稀疏性问题。接着，详细阐述了Weighted LSSVM（WLSSVM）的数学原理，包括误差权重的计算方法和优化模型。最后，提供了WLSSVM的Python实现，着重强调了模型的稀疏化方法。

摘要由CSDN通过智能技术生成

【机器学习】Weighted LSSVM原理与Python实现：LSSVM的稀疏化改进

一、LSSVM
- 1、LSSVM用于回归
- 2、LSSVM模型的缺点
二、WLSSVM的数学原理
三、WLSSVM的python实现
参考资料

一、LSSVM

1、LSSVM用于回归

本人在之前的博客（参考资料【1】）介绍了LSSVM的分类模型，本节将介绍LSSVM的回归模型。
对于回归算法，我们希望通过训练数据中学习到回归方程：

$\cdot \varphi \left( x \right) + b$

其中 $\varphi \left( x \right)$ 用于将 $x$ 映射到更高维的特征空间内。
LSSVR回归模型的优化思想是使离回归平面距离最大的样本与回归平面之间的距离最小。优化问题为：

$\begin{array}{l} \mathop {\min }\limits_{W,b} \frac{1}{ {\left\| W \right\|}}\\ s.t.{y_i} = W\varphi \left( { {x_i}} \right) + b \end{array}$

为了解决存在部分特异点的情况，给每一个样本引入误差变量 ${e_i}$ ,，并在原始函数中加入误差变量的L2正则项。这样LSSVM的优化问题就转化为:

$\begin{array}{l} \mathop {\max }\limits_{W,b} \frac{1}{2}{\left\| W \right\|^2} + \frac{\lambda }{2}\sum\limits_{i = 1}^m { {e_i}^2} \\ s.t.{y_i} = W\varphi \left( { {x_i}} \right) + b + {e_i} \end{array}$

由此可见，LSSVM分类模型和LSSVM回归模型的求解方法是相同的。
LSSVM回归模型的输出为：
$f\left( x \right) = W \cdot \varphi \left( x \right) + b = \sum\limits_{i = 1}^m { {\alpha _i}k\left( { {x_i},x} \right) + b}$

2、LSSVM模型的缺点

缺少稀疏性：对于每一次预测都需要所有的训练数据参与。因为LSSVM模型求解中的Lagrange乘子都是非零数值（不同于SVM模型，只有支持向量对应的Lagrange乘子才是非零数值）。只有当误差变量 ${e_i}$ 的分布符合高斯分布的时候，支持向量数值的估计才是最优的【参考资料2】（个人理解：当误差变量 ${e_i}$ 的分布符合高斯分布的时候，有助于将异常的样本点排除）。