机器学习—感知机

最新推荐文章于 2024-03-07 21:40:44 发布

贰锤

最新推荐文章于 2024-03-07 21:40:44 发布

阅读量427

点赞数

分类专栏：机器学习文章标签：机器学习感知机

本文链接：https://blog.csdn.net/weixin_37895339/article/details/78790277

版权

28 篇文章 4 订阅

订阅专栏

感知机是一种简单的二类分类的线性分类模型，用于处理可以线性可分的二分类问题。感知机对应于输入空间（特征空间）中将实例划分为正负两类的分离超平面，属于判别模型。

模型。从输入空间到输出空间有如下函数
$f (x) = s i g n (w T x + b)$ $f(x)=sign(w^Tx+b)$
其中 $w$ 为权值， $b$ 为偏执。生成的超平面为
$w T x + b = 0$ $w^Tx+b = 0$
其中 $w$ 为超平面的法向量， $b$ 为超平面的截距，超平面到原点的距离为 $-\frac{b}{||w||}$ .

策略。损失函数选取为误分类点到超明面的总距离
$L (w, b) = - \sum x i \in M y i (w T x i + b)$ $L(w,b) = -\sum\limits_{x_i \in M}y_i(w^Tx_i+b)$
其中 $M$ 为误分类点的集合。

采用随机梯度下降法，极小化过程不是一次使用M中所有的误分类点进行梯度下降，而是每次随机选取一个误分类点使梯度下降。算法为

w \leftarrow w + η y i x i b \leftarrow b + η y i

$w \leftarrow w+ \eta y_i x_i \\ b \leftarrow b + \eta y_i$
其中

0≤η≤1 $0\le \eta \le1$ 为学习速率。

选取初值 w，b
while L>0
    随机选一个样本：
        if yi*(w*xi+b)<=0
            w=w+eta*yi*xi
            b=b+eta*yi

感知机学习算法由于采用不同的初值或选取不同的误分类点，解可以不同。

上述原始算法对权值修正为

w \leftarrow w + η y i x i b \leftarrow b + η y i

$w \leftarrow w+ \eta y_i x_i \\ b \leftarrow b + \eta y_i$
若修改n次，则

w,b $w,b$ 的关于

(xi,yi) $(x_i,y_i)$ 增量分别是

αiyixi $\alpha_iy_ix_i$ 与

αiyi $\alpha_iy_i$ ，这里

αi=niη $\alpha_i=n_i\eta$ ，

ni $n_i$ 表示

(xi,yi) $(x_i,y_i)$ 被选为误分类点的次数。则最后的权值参数可以表示为

w = \sum i = 1 N α i y i x i b = \sum i = 1 N α i y i

$w=\sum\limits_{i=1}^{N}\alpha_iy_ix_i\\ b = \sum\limits_{i=1}^{N}\alpha_iy_i$
实例点更次次数越多，意味着它距离分类超平面越近，也就越难正确分类，这样的点对学习结果影响最大。
算法：
1.

α←0,b←0 $\alpha \leftarrow 0,b \leftarrow 0$
2. 在训练集中选取数据

(xi,yi) $(x_i,y_i)$
3. 如果

yi(∑j=1Nαjyjxj⋅xi+b)≤0 $y_i(\sum\limits_{j=1}^{N}\alpha_jy_jx_j\cdot x_i + b)\le 0$

α i = α i + η b = b + η y i

$\alpha_i = \alpha_i +\eta\\ b=b+\eta y_i$
4. 转到2，直到没有误分类数据
对偶形势中，训练实例仅以内积的形式出现，则可以离线的计算出内积并存储到矩阵中，这个矩阵则为Gram矩阵

G = [x i \cdot x j] N \times N

$G=[x_i\cdot x_j]_{N\times N}$

关注