1、 原理
感知器是根据输入实例的特征向量x对其进行二类分类的线性分类模型:
f(x)=sign(w∗x+b)
感知器模型对应特征空间的分离超平面 w∗x+b=0 。
2、损失函数
损失函数对应与误分类点到分离超平面的总距离。误分类点越少,误分类点距离超平面越近,损失函数值越小。
minL(w,b)=−∑xi∈Myi(w∗xi+b)
3、流程
输入:训练数据集
T=(x1,y1),(x2,y2),....,(xN,yN)
,其中
xi∈Rn;yi∈{−1,+1};i=1,2,...,N;
学习率
α∈(0,1)
。
输出:w,b;感知器模型
f(x)=sign(w∗x+b)
- 选取初值 w0,b0
- 采用SGD,选取数据 (xi,yi)
如果 yi(w∗xi+b)≤0
∇wL(w,b)=−∑xi∈Myixi
∇bL(w,b)=−∑xi∈Myi
w←w+αyixi
b←b+αyi4转到2,直到训练集中没有误分类点