机器学习：感知机、线性回归和Logistic回归（待续~）

最新推荐文章于 2024-03-11 13:42:54 发布

牛顿爱吃香蕉

最新推荐文章于 2024-03-11 13:42:54 发布

阅读量1k

点赞数 1

分类专栏：机器学习文章标签：线性分类器感知机 PLA 线性回归 Logistic回归

本文链接：https://blog.csdn.net/weixin_41665360/article/details/95617067

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

从感知机到线性回归，从线性回归到Logistic回归

1、感知机

感知机的直观解释为，使用超平面将特征空间中的一组实例分割开来。定义该超平面为： $W^Tx+b=0$ 。数据标签取值： $y_i\in\{+1,-1\}$ 。

1.1、模型

该模型决策函数为：
$f(x)=sign(W^Tx+b)\tag1$
当 $f (x) > 0$ 预测为正例， $f (x) < 0$ 预测为负例。

1.2、学习策略

对于模型误分类的样本：
$-y_i(W^Tx+b)>0\tag2$
误分类样本到分类超平面的距离为：
$-\frac{y_i(W^Tx_i+b)}{||W||}\tag3$
其中， $∣ ∣ W ∣ ∣$ 为超平面法向量的 $L_2$ 范数。因此，不妨将其设为 $1$ 。

给定训练数据集 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ，在模型上发生误分类的样本子集为 $M$ ，则所有误分类样本到分类超平面的距离和为：
$L(W,b)=-\sum\limits_{x_i\in M}y_i(W^Tx+b)\tag4$

1.3、学习算法

显然，优化过程中，我们选择使 $L (W, b)$ 最小的模型作为最终模型。即选择 $(W, b)$ 使得
$L_{min}(W,b)=-\sum\limits_{x_i\in M}y_i(W^Tx+b)$
已知损失函数 $L (W, b)$ 的梯度为：
$\begin{aligned} \nabla_WL(W,b)&=-\sum\limits_{x_i\in M}y_ix_i\\ \nabla_bL(W,b)&=-\sum\limits_{x_i\in M}y_i \end{aligned} \tag5$
选择随机梯度下降（ $S G D$ ）的优化方法，每次从误分类集合 $M$ 中选择一个样本 $x_i,y_i)$ ，更新 $W, b$ 如下：
$\begin{aligned} W&\leftarrow W+\eta y_ix_i\\ b&\leftarrow b+\eta y_i\tag6 \end{aligned}$
综上，算法学习过程表示如下：

输入：数据集 $T$ ，学习率 $\eta(0<\eta\le1)$
1. 选取初始 $W_0,b_0$
2. 在训练集中选取 $x_i,y_i)$
3. 如果 $y_i(W^Tx+b)\le0$ ：
$\begin{aligned}W&\leftarrow W+\eta y_ix_i\\b&\leftarrow b+\eta y_i\end{aligned}$
4. 不满足条件 3 则转到步骤 2

以上算法可以直观地解释为：当样本发生误分类时，调整 $W, b$ 使分类超平面向误分类样本一侧移动，从而减小误分类样本与分类超平面之间的距离，直至超平面将该样本正确分类为止。

1.4、PLA 对偶形式

通过观察式 $(6)$ 可知：每个误分类样本下， $W$ 每次更新的步长相同，当 $W, b$ 均以 $0$ 初始化时，可以得出：
$\begin{aligned} W&=\sum\limits_{i=1}^{n}n_i\eta y_ix_i\\ b&=\sum\limits_{i=1}^{n}n_i\eta y_i \end{aligned}\tag7$
令 $\alpha_i=n_i\eta$ ，可得：
$\begin{aligned} W&=\sum\limits_{i=1}^{n}\alpha_i y_ix_i\\ b&=\sum\limits_{i=1}^{n}\alpha_i y_i \end{aligned}\tag8$
故对偶算法为：

输入：数据集 $T$ ，学习率 $\eta(0<\eta\le1)$
1. $\alpha\leftarrow0, b\leftarrow0$
2. 在训练集中选取 $x_i,y_i)$
3. 如果 $y_i(\sum\limits_{j=1}^{n}\alpha_jy_jx_jx_i+b)\le0$ ：
$\begin{aligned}\alpha_i&\leftarrow \alpha_i+\eta\\b&\leftarrow b+\eta y_i\end{aligned}$
4. 不满足条件 3 则转到步骤 2 直到样本 $x_i$ 正确分类