感知机模型
对于一组特征向量 X=(X1,X2,⋯,Xd) , y:+1,−1 ,将特征向量与权值向量做内积,其计算结果与阀值作比较进而输出结果
h∈H
例:在二维空间中,h函数表示为
h(X)=sign(W0+W1X1+W2X2)
空间中的点表示特征向量,标签y表示输出值,O表示+1,x表示-1,空间中的线表示假设
感知机学习算法
通过不断修正的方式,初始化的 W0 ,通过 D 训练样本不断修正。
具体算法:
在 t=0,1,⋯ 循环过程中
存在 (Xn(t),yn(t)) 在 Wt 的规则下是错误的,即 sign(WTtXn(t))≠yn(t)
通过 Wt+1←Wt+yn(t)Xn(t) 进行修正
直到没有错误返回 W 为
g
实际上W即为分割线的法向量,sign即为X在W方向上的分量与W是同向还是反向。
感知机算法的收敛性
PLA数据线性可分
假设 D 是线性可分的,那么PLA是否一定会停止
非线性可分数据集
但是PLA的前提是指导数据集是线性可分的
数据集中普遍存在噪声
解决办法
找一个在已知数据集上犯错最少的线
初始化当前最优预测向量 W^ ,在 t=0,1,⋯ 循环过程中
存在 (Xn(t),yn(t)) 在 Wt 的规则下是错误的
通过 Wt+1←Wt+yn(t)Xn(t) 进行修正
如果新的 Wt+1 比 W^ 犯的错少,跟新 W^ 为 Wt+1
直到做了足够多次循环,返回 W^ 为 g