机器学习算法（分类算法）—Rosenblatt感知机的对偶解法

最新推荐文章于 2024-02-18 11:00:00 发布

jim_cainiaoxiaolang

最新推荐文章于 2024-02-18 11:00:00 发布

阅读量1k

点赞数 1

分类专栏：机器学习和深度学习

本文链接：https://blog.csdn.net/jim_cainiaoxiaolang/article/details/53169376

版权

38 篇文章 2 订阅

订阅专栏

一、Rosenblatt感知机回顾

在博文“简单易学的机器学习算法——Rosenblatt感知机”中介绍了Rosenblatt感知机的基本概念。Rosenblatt感知机是针对线性可分问题的二分类算法。通过构造分离超平面将正类和负类区分开。构造了如下的输入空间到输出空间的函数：

$f\left ( x \right )=sign\left ( w\cdot x+b \right )$

其中， $w$ 为权重， $b$ 为偏置。 $f\left ( x \right )=sign\left ( x \right )$ 为符号函数：

$sign\left ( x \right )=\begin{cases} +1 & \text{ if } x\geq 0 \\ -1 & \text{ if } x<0 \end{cases}$

求解这个函数的重点就是求解函数中的参数： $w$ 和 $b$ 。Rosenblatt感知机通过构造损失函数 $L\left ( w,b \right )$ ，并求得使得这样的损失函数达到最小时的 $w$ 和 $b$ 。

其中， $L\left ( w,b \right )$ 为：

$L\left ( w,b \right )=-\sum_{x_i\in M}y_i\left ( w\cdot x_i+b \right )$

这里的 $M$ 为所有误分类的点的集合。我们的目标是求得损失函数的最小值： $minL\left ( w,b \right )$ 。

通过梯度下降法(详细请见“简单易学的机器学习算法——Rosenblatt感知机”)，我们得到了 $w$ 和 $b$ 的更新公式：

$w\leftarrow w+\eta y_ix_i$

$b\leftarrow b+\eta y_i$

其中， $\eta$ 为学习率。

对偶形式的基本想法是，将 $w$ 和 $b$ 表示为实例 $x_i$ 和标记 $y_i$ 的线性组合的形式，通过求解其系数而求得 $w$ 和 $b$ 。

通过上面的 $w$ 和 $b$ 的更新公式，我们发现， $w$ 和 $b$ 是一个累加的过程。如果令 $w_0=0$ ， $b_0=0$ ，则 $w$ 和 $b$ 可以表示为：

$\left\{\begin{matrix} w = \sum_{i=1}^{N}\alpha _iy_ix_i\\ b=\sum_{i=1}^{N}\alpha _iy_i \end{matrix}\right.$

其中， $\alpha _i=n_i\eta$ 。

此时的感知机模型就变为：

$f\left ( x \right )=sign\left ( \sum_{j=1}^{N}\alpha _jy_jx_j\cdot x+b \right )$

初始化 $\alpha \leftarrow 0$ ， $b \leftarrow 0$
选择误分类数据点，即 $y_i\left ( \sum_{j=1}^{N}\alpha _jy_jx_j\cdot x_i+b \right )\leq 0$ ，更新 $\alpha _i$ 和 $b$

$\alpha _i \leftarrow \alpha _i+\eta$

$b \leftarrow b+\eta y_i$

利用博文“简单易学的机器学习算法——Rosenblatt感知机”中的数据集，原始数据集如下图所示：

(原始数据点)

MATLAB代码

[plain] view plain copy

最终的分离超平面：

(最终分离超平面)

关注

专栏目录