概念
感知机是二分类的线性模型,输入为实例的特征向量,输出为实例的类别,取 {-1, +1}。感知机学习的目的在于找到某个超平面,能将正负实例完全分离,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数极小化,以此求得感知机模型。
定义
假设输入空间
X
⊆
R
n
X \subseteq \mathbb{R}^{n}
X⊆Rn,输出空间
Y
=
{
+
1
,
−
1
}
Y=\{+1,-1\}
Y={+1,−1} 。输入x表示实例的特征向量,对应于输入空间的点,输出y表示实例的类别。由输入空间到输出空间的如下函数:
f
(
x
)
=
sign
(
w
⋅
x
+
b
)
\begin{aligned}f(x)=\operatorname{sign}(w \cdot x+b)\end{aligned}
f(x)=sign(w⋅x+b)称为感知机。其中,
w
{w}
w 和
b
{b}
b 为模型参数,
w
⊆
R
n
w \subseteq \mathbb{R}^{n}
w⊆Rn叫做权值向量,
b
⊆
R
b \subseteq \mathbb{R}
b⊆R叫做偏置。sign(x)为符号函数:
s
i
g
n
(
x
)
=
{
+
1
,
x
≥
0
−
1
,
x
<
0
\begin{aligned} {sign}(x)=\left\{\begin{array}{ll}+1, & x \geq 0 \\ -1, & x<0\end{array}\right. \end{aligned}
sign(x)={+1,−1,x≥0x<0感知机模型的假设空间是定义在特征空间中的所有线性分类模型或线性分类器,即函数集合
{
f
∣
f
(
x
)
=
w
⋅
x
+
b
}
\{f \mid f(x)=w \cdot x+b\}
{f∣f(x)=w⋅x+b}
几何解释
感知机可解释为线性方程:
w
⋅
x
+
b
=
0
w·x+b=0
w⋅x+b=0对应于特征空间中的一个超平面
S
S
S,其中
w
w
w是超平面的法向量,
b
b
b是超平面的截距。超平面
S
S
S将特征空间划分为两部分,位于这两部分的点对应被分为正、负两类。如下图所示:
下一章:感知机学习策略