-
二分类线性模型
f ( x ) = s i g n ( w ⋅ x + b ) , s i g n ( x ) = { + 1 , x ≥ 0 − 1 , x > 0 f(x) = sign(w·x+b),sign(x) = \begin{cases} +1,x\geq0\\ -1,x>0\\ \end{cases} f(x)=sign(w⋅x+b),sign(x)={+1,x≥0−1,x>0
∙ \bullet ∙ 当满足: y i = + 1 , w ⋅ x i + b ≥ 0 , 且 y i = − 1 , w ⋅ x + b < 0 时 y_i = +1,w·x_i+b\ge0,且 y_i=-1,w·x+b<0 时 yi=+1,w⋅xi+b≥0,且yi=−1,w⋅x+b<0时,称该数据集线性可分。
当数据集线性可分时,感知器可以收敛;当数据集线性不可分时,感知器不收敛,发生震荡。
-
损失函数
损失函数被构建为,所有误分类点到超平面的总距离。
(点到线距离公式: d = ∣ w ⋅ x + b ∣ ∣ ∣ w ∣ ∣ 2 d = \frac{| w·x+b |}{\sqrt{||w||_2}} d=∣∣w∣∣2∣w⋅x+b∣)
即, L ( w , b ) = − 1 ∣ ∣ w ∣ ∣ 2 ∑ x i ∈ X y i ( w ⋅ x i + b ) L(w,b)=-\frac{1}{||w||_2}\sum_{x_i∈X}y_i(w·x_i+b) L(w,b)=−∣∣w∣∣21∑xi∈Xyi(w⋅xi+b),
若不考虑 − 1 ∣ ∣ w ∣ ∣ 2 -\frac{1}{||w||_2} −∣∣w∣∣21 ,则得到 L ( w , b ) = ∑ x i ∈ X y i ( w ⋅ x i + b ) L(w,b)=\sum_{x_i∈X}y_i(w·x_i+b) L(w,b)=∑xi∈Xyi(w⋅xi+b)
-
梯度下降更新参数
w : = w + η ⋅ y i x i w:=w+η·y_ix_i w:=w+η⋅yixi
b : = b + η ⋅ y i b:=b+η·y_i b:=b+η⋅yi
若 y i ( w ⋅ x i + b ) ≥ 0 y_i(w·x_i+b)\ge0 yi(w⋅xi+b)≥0 意味着 y i 与 w ⋅ x i + b y_i 与 w·x_i+b yi与w⋅xi+b 同号,分类正确;
若 y i ( w ⋅ x i + b ) < 0 y_i(w·x_i+b)<0 yi(w⋅xi+b)<0 意味着 y i 与 w ⋅ x i + b y_i 与 w·x_i+b yi与w⋅xi+b 异号,分类错误;应当在 y i ( w ⋅ x i + b ) < 0 y_i(w·x_i+b)<0 yi(w⋅xi+b)<0 时进行修正,即 x i x_i xi 位于超平面错误一侧时调整 w , b w,b w,b ,使超平面向误分类点一侧移动。
-
线性分类器的理解
-
空间划分角度
将每个样本中提取出的特征视为空间中的点坐标,则 w ⋅ x + b w·x+b w⋅x+b 是一个超平面,可以将不同类别的样本划分开。
当一个超平面无法区分样本,达到最好划分效果时,可以使用多个超平面进行划分,每一个 w ⋅ x + b w·x+b w⋅x+b 都对应一个超平面。
-
模板匹配角度
将 w , b w,b w,b 视为模板, x i x_i xi 代入计算后得出的值视为匹配度。
-
机器学习 - 感知器
最新推荐文章于 2023-09-10 00:38:03 发布