感知机
感知机模型
- 感知机解决的问题:
感知机是解决二分类问题的线性分类模型。感知机学习目标是求得一个能够将训练集正实例点和负实例点完全正确分开的分离超平面。为此,导入基于误分类的损失函数,分离超平面的确定由求得损失函数极小值确定。感知机是神经网络与支持向量机的基础。 - 感知机模型函数
f(x)=sign(wx+b) f ( x ) = s i g n ( w x + b )
w w 和为模型参数, w w 为权值或者权重向量。sign为符号函数:
线性方程 wx+b=0 w x + b = 0 对应特征空间的一个超平面 S S ,为超平面的法向量, b b 为超平面的截距。感知机模型如下图所示:
平面方程表示参考:
http://www.cnblogs.com/graphics/archive/2010/07/10/1774809.html
损失函数
感知机的损失函数为:所有误分类点到超平面的总距离:
首先点
x0
x
0
到超平面
S
S
的距离为:
||w|| | | w | | 是 w w 的范数, L2 L 2 表示向量各元素的平方和。
对于分类错误的点 (xi,yi) ( x i , y i ) ,总有 −yi(wxi+b)>0 − y i ( w x i + b ) > 0 成立,当 wxi+b>0 w x i + b > 0 时, yi=−1 y i = − 1 ; wxi+b<0 w x i + b < 0 时, yi=1 y i = 1 ;假设超平面 S S 的误分类点集合为,那么所有误分类点到超平面 S S 的总距离为:
上式不考虑 −1||w|| − 1 | | w | | ,得到感知机的损失函数:
L(w,b)=−∑xi∈Myi(wxi+b)
L
(
w
,
b
)
=
−
∑
x
i
∈
M
y
i
(
w
x
i
+
b
)
- 感知机的学习策略
求得参数 w w ,;使其损失函数极小化问题的解(目标函数):
minw,bL(w,b)=−∑xi∈Myi(wxi+b)
m
i
n
w
,
b
L
(
w
,
b
)
=
−
∑
x
i
∈
M
y
i
(
w
x
i
+
b
)
M M 是误分类点的集合,感知机学习方法是误分类驱动的,采用随机下降法求得参数值,极小化目标函数中,一次随机选取一个误分类点使其梯度下降,并更新和 b b <script type="math/tex" id="MathJax-Element-61">b</script>的值。重复上述过程,直至所有点都正确分类。