支持向量回归(SVR)

最新推荐文章于 2025-03-19 09:00:00 发布

handsomeboysk

最新推荐文章于 2025-03-19 09:00:00 发布

阅读量5.1k

点赞数 15

文章标签：回归数据挖掘人工智能

本文链接：https://blog.csdn.net/handsomeboysk/article/details/143067819

版权

支持向量回归（Support Vector Regression, SVR）是支持向量机（SVM）的一种扩展，用于回归分析，即用于预测连续数值型目标。它的原理与分类任务中的支持向量机类似，SVR 通过最大化回归模型的间隔，同时允许部分样本违反一定的误差范围，以提高模型的鲁棒性。

1. 支持向量回归的基本概念

与分类中的 SVM 相似，SVR 也试图在数据点中找到一个“最优超平面”，但在回归问题中，这个超平面是一个回归函数，它尽可能接近数据点，并在允许误差的范围内做出预测。

在 SVR 中，我们需要找到一个函数 $f (x)$ ，使得它能够预测样本的输出值，并且误差尽可能地小。同时，允许误差在一定的范围内，而不去惩罚这些误差。这种允许误差的范围由一个参数 $\epsilon$ 控制，这就是 SVR 的 $\epsilon$ -不敏感损失函数。

2. $\epsilon$ -不敏感损失函数

在 SVR 中，引入了一个 $\epsilon$ 参数，用来表示误差的容忍范围。如果预测值与真实值之间的差异小于 $\epsilon$ ，则认为没有损失。如果差异大于 $\epsilon$ ，则产生损失。

损失函数：

对于每个样本 $x_i, y_i)$ ，SVR 的损失函数定义为：

$L_{\epsilon}(y_i, f(x_i)) = \max(0, |y_i - f(x_i)| - \epsilon)$

当预测值 $f(x_i)$ 与真实值 $y_i$ 之间的差异小于 $\epsilon$ 时，损失为零，即不惩罚误差。
当差异大于 $\epsilon$ 时，损失为 $|y_i - f(x_i)| - \epsilon$ 。

这种损失函数叫做 $\epsilon$ -不敏感损失（ $\epsilon$ -insensitive loss），它允许一定范围内的误差，而不对模型产生惩罚。

3. 支持向量回归的优化目标

SVR 的目标是找到一个函数 $f(x) = w^T x + b$ ，使得大多数样本的预测误差不超过 $\epsilon$ ，同时尽量使模型简单（即最大化回归函数的间隔）。因此，SVR 的优化目标可以写作：

优化问题：

$\min_{w, b, \xi_i, \xi_i^*} \ \frac{1}{2} \|w\|^2 + C \sum_{i=1}^n (\xi_i + \xi_i^*)$

其中：

$\frac{1}{2} \|w\|^2$ ：用于控制模型的复杂度，保持函数的平滑性。
$\sum_{i=1}^n (\xi_i + \xi_i^*)$ ：对违反 $\epsilon$ 不敏感损失函数的样本施加惩罚，控制误差。
$\xi_i$ 和 $\xi_i^*$ ：松弛变量，用于处理误差大于 $\epsilon$ 的样本，分别表示预测值高于或低于真实值时的误差。

约束条件：

对于每个样本 $x_i, y_i)$ ，约束条件是：
$y_i - (w^T x_i + b) \leq \epsilon + \xi_i^*$
$(w^T x_i + b) - y_i \leq \epsilon + \xi_i$
$\xi_i, \xi_i^* \geq 0$

这些约束条件保证了大部分数据点的预测值 $f(x_i) = w^T x_i + b$ 距离真实值 $y_i$ 的误差不超过 $\epsilon$ ，允许有一部分样本的误差通过松弛变量 $\xi_i$ 和 $\xi_i^*$ 来表示。

4. 对偶问题的推导

为了求解 SVR 的优化问题，通常会将其转化为对偶问题。SVR 的对偶问题与支持向量分类器的对偶问题类似：

拉格朗日函数

我们引入拉格朗日乘子 $\alpha_i, \alpha_i^*, \lambda_i, \lambda_i^*$ 来处理约束条件，构造拉格朗日函数：

$\xi_i, \xi_i^*, \alpha_i, \alpha_i^*, \lambda_i, \lambda_i^*) = \frac{1}{2} \|w\|^2 + C \sum_{i=1}^n (\xi_i + \xi_i^*) - \sum_{i=1}^n \alpha_i [\epsilon + \xi_i - y_i + w^T x_i + b] - \sum_{i=1}^n \alpha_i^* [\epsilon + \xi_i^* + y_i - w^T x_i - b] - \sum_{i=1}^n (\lambda_i \xi_i + \lambda_i^* \xi_i^*)$

通过对 $w$ 、 $b$ 、 $\xi_i$ 、 $\xi_i^*$ 求偏导并消去这些变量，可以得到 SVR 的对偶问题。

对偶优化问题：

$\max_{\alpha_i, \alpha_i^*} \ - \frac{1}{2} \sum_{i,j=1}^n (\alpha_i - \alpha_i^*) (\alpha_j - \alpha_j^*) x_i^T x_j - \epsilon \sum_{i=1}^n (\alpha_i + \alpha_i^*) + \sum_{i=1}^n y_i (\alpha_i - \alpha_i^*)$