机器学习 02:感知机的对偶形式

误分类点:

设一个点 x ⃗ \vec x x 被误分类了 n n n 次,则由于 ∇ L = < x ⃗ y , y > \nabla L=<\vec xy,y> L=<x y,y>,更新了 n n n 次后的 w ⃗ \vec w w 为:
w ⃗ = α n x ⃗ y \begin{aligned}\vec w&=\alpha n\vec xy\end{aligned} w =αnx y

对所有的点来说:
w ⃗ = ∑ α n i x ⃗ i y i \begin{aligned}\vec w&=\sum\alpha n_i\vec x_iy_i\end{aligned} w =αnix iyi

所以当 ( ∑ α n i x ⃗ i y i x ⃗ j + b ) y j < 0 (\sum\alpha n_i\vec x_iy_i\vec x_j+b)y_j<0 (αnix iyix j+b)yj<0 时, x ⃗ j \vec x_j x j 就是误分类点。

为了简化计算,我们可以将 x ⃗ i x ⃗ j \vec x_i\vec x_j x ix j 预先取出,形成一个矩阵,这样可以免去重复的计算。



更新权重项与偏置项:

由于 n n n 代表一个点被误分类的次数,所以每次找到误分类点后,只需要 n + 1 n+1 n+1 即相当于更新了权重项。或者简化一下,设 a = α n a=\alpha n a=αn 则每次更新时只需要:
a + = α b + = α y i \begin{aligned}a&+=\alpha\\b&+=\alpha y_i\end{aligned} ab+=α+=αyi

模板:

import numpy as np

X_train = np.array([[1, 1], [1, 0], [0, 1], [0, 0]])
Y_train = np.array([1, 1, 1, -1])

class perceptron:
    def __init__(self, X, Y, Alpha = 0.01):
        self.alpha = Alpha
        self.X_trn = np.array(X)
        self.Y_trn = np.array(Y)
        self.B = np.random.rand()
        self.lenth = len(self.X_trn)
        self.a = np.zeros(self.lenth)
        
        self.mat = np.zeros((self.lenth, self.lenth))
        for i in range(self.lenth):
            for j in range(self.lenth):
                self.mat[i, j] = np.dot(self.X_trn[i], self.X_trn[j])

    def check(self, j):
        Sum = np.dot(self.a * self.Y_trn, self.mat[j]) + self.B
        if (Sum * self.Y_trn[j] >= 0):
            return True
        else:
            return False

    def Loss_func(self, j):
        self.a[j] += self.alpha
        self.B += self.alpha * self.Y_trn[j]

    def train(self):
        Error = True
        k = 0
        while (Error):
            Error = False
            for i in range(self.lenth):
                if (self.check(i) == False):
                    self.Loss_func(i)
                    Error = True
        print(self.a)
        print("W: ", np.dot(self.a * self.Y_trn, self.X_trn), " B: ", self.B)

per = perceptron(X_train, Y_train, 0.01)
per.train()




同步更新于:SP-FA 的博客


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SP FA

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值