感知机
感知机模型
分离超平面
输入空间(特征空间)为 x ⊆ R n x\subseteq R^n x⊆Rn,输出空间为 y = { + 1 , − 1 } y=\{+1, -1\} y={
+1,−1},从输入空间到输出空间的函数为
f ( x ) = s i g n ( w ⋅ x + b ) (1) f(x)=sign(w·x+b) \tag 1 f(x)=sign(w⋅x+b)(1)
其中 w ∈ R n w\in R^n w∈Rn,叫做权值向量; b ∈ R b\in R b∈R叫做偏置(注意不是 R n R^n Rn);sing是符号函数,即
s i n g ( x ) = { + 1 , x ≥ 0 − 1 , x < 0 (2) sing(x)=\left\{\begin{array}{ll} +1, & x\ge 0 \\ -1, & x<0 \end{array}\right. \tag 2 sing(x)={
+1,−1,x≥0x<0(2)
感知机模型需要在特征空间 R n R^n Rn中找到一个分离超平面S将特征空间划分为两部分,位于这两部分的点也就被分为了正负两大类。该分离超平面S的线性方程为
w ⋅ x + b = 0 (3) w·x+b=0 \tag 3 w⋅x+b=0(3)
其中w是超平面的法向量;b是超平面的截距
损失函数
要将若干点 x i ∈ x ⊆ R n x_i\in x \subseteq R^n xi∈x⊆Rn正确划分到正负两大类中,就需要找到一个分离超平面对任意实例i都遵从下式
{ w ⋅ x i + b > 0 , y i = + 1 w ⋅ x i + b < 0 , y i = − 1 (4) \left\{\begin{array}{ll} w·x_i+b>0, & y_i=+1 \\ w·x_i+b<0, & y_i=-1 \end{array}\right. \tag 4 {
w⋅xi+b>0,w⋅xi+b<0,yi=+1yi=−1(4)
若有实例点不遵从(4),则是误分类数据,对于误分类数据 ( x i , y i ) (x_i,y_i) (xi,yi)来说
{ y i = − 1 , w ⋅ x i + b > 0 y i = + 1 , w ⋅ x i + b < 0 (5) \left\{\begin{array}{ll} y_i=-1, & w·x_i+b>0 \\ y_i=+1, & w·x_i+b<0 \end{array}\right. \tag 5