1.感知机模型
输出空间 y = { + 1 , − 1 } y=\{+1,-1\} y={
+1,−1},由输入空间到输出空间的如下函数:
f ( x ) = s i g n ( w ⋅ x + b ) f(x)=sign(w\cdot x+b) f(x)=sign(w⋅x+b)
称之为感知机。
符号函数:
s i g n ( x ) = { + 1 x >=0 − 1 x < 0 sign(x)= \begin{cases} +1 & \text{x >=0}\\ -1 & \text{x < 0} \end{cases} sign(x)={
+1−1x >=0x < 0
感知机有如下几何解释:线性方程:
w ⋅ x + b = 0 w\cdot x+b=0 w⋅x+b=0
对应于特征空间 R n R^n Rn的一个超平面S,其中 w w w是超平面的法向量,b是超平面的截距。这个超平面将特征空间划分为两个部分。位于两部分的点(特征向量)分别被分为正、负两类。所以S被称为分离超平面。
2.感知机学习策略
2.1 数据集的线性可分
对于 T = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . . . . ( x n , y n ) } T=\{(x_1,y_1),(x_2,y_2),......(x_n,y_n)\} T={ (x1,y1),(x2,y2),......(x