机器学习 - 感知器

  • 二分类线性模型

    f ( x ) = s i g n ( w ⋅ x + b ) , s i g n ( x ) = { + 1 , x ≥ 0 − 1 , x > 0 f(x) = sign(w·x+b),sign(x) = \begin{cases} +1,x\geq0\\ -1,x>0\\ \end{cases} f(x)=sign(wx+b)sign(x)={+1x01x>0

    ∙ \bullet 当满足: y i = + 1 , w ⋅ x i + b ≥ 0 , 且 y i = − 1 , w ⋅ x + b &lt; 0 时 y_i = +1,w·x_i+b\ge0,且 y_i=-1,w·x+b&lt;0 时 yi=+1wxi+b0yi=1wx+b<0,称该数据集线性可分。

    当数据集线性可分时,感知器可以收敛;当数据集线性不可分时,感知器不收敛,发生震荡。

  • 损失函数

    损失函数被构建为,所有误分类点到超平面的总距离。

    (点到线距离公式: d = ∣ w ⋅ x + b ∣ ∣ ∣ w ∣ ∣ 2 d = \frac{| w·x+b |}{\sqrt{||w||_2}} d=w2 wx+b

    即, L ( w , b ) = − 1 ∣ ∣ w ∣ ∣ 2 ∑ x i ∈ X y i ( w ⋅ x i + b ) L(w,b)=-\frac{1}{||w||_2}\sum_{x_i∈X}y_i(w·x_i+b) L(w,b)=w21xiXyi(wxi+b)

    若不考虑 − 1 ∣ ∣ w ∣ ∣ 2 -\frac{1}{||w||_2} w21 ,则得到 L ( w , b ) = ∑ x i ∈ X y i ( w ⋅ x i + b ) L(w,b)=\sum_{x_i∈X}y_i(w·x_i+b) L(w,b)=xiXyi(wxi+b)

  • 梯度下降更新参数

    w : = w + η ⋅ y i x i w:=w+η·y_ix_i w:=w+ηyixi

    b : = b + η ⋅ y i b:=b+η·y_i b:=b+ηyi

    y i ( w ⋅ x i + b ) ≥ 0 y_i(w·x_i+b)\ge0 yi(wxi+b)0 意味着 y i 与 w ⋅ x i + b y_i 与 w·x_i+b yiwxi+b 同号,分类正确;
    y i ( w ⋅ x i + b ) &lt; 0 y_i(w·x_i+b)&lt;0 yi(wxi+b)<0 意味着 y i 与 w ⋅ x i + b y_i 与 w·x_i+b yiwxi+b 异号,分类错误;

    应当在 y i ( w ⋅ x i + b ) &lt; 0 y_i(w·x_i+b)&lt;0 yi(wxi+b)<0 时进行修正,即 x i x_i xi 位于超平面错误一侧时调整 w , b w,b w,b ,使超平面向误分类点一侧移动。

  • 线性分类器的理解

    1. 空间划分角度

      将每个样本中提取出的特征视为空间中的点坐标,则 w ⋅ x + b w·x+b wx+b 是一个超平面,可以将不同类别的样本划分开。

      当一个超平面无法区分样本,达到最好划分效果时,可以使用多个超平面进行划分,每一个 w ⋅ x + b w·x+b wx+b 都对应一个超平面。

    2. 模板匹配角度

      w , b w,b w,b 视为模板, x i x_i xi 代入计算后得出的值视为匹配度。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值