感知机模型
定义(感知机)假设输入空间(特征空间)是属于,输出空间是y={+1,-1}.输入属于表示实例的特征向量,对应于输出空间(特征空间)的点,输出y表示实例的类别。由输入空间到输出空间的如下函数称为感知机.其中,w和b为感知机模型参数,w叫做权值或者权值向量,b叫做偏置,表示w和x的内积,sign是符号函数,即
感知机模型的假设空间是定义在特征空间中的所有线性分类模型或线性分类器,即函数集合{}
感知机的几何解释:
线性方程:对应于特征空间中的一个超平面S,其中w是超平面的法向量,b是超平面的截距,这个超平面将特征空间划分为两个部分。位于两部分的点(特征向量)分别为正负两类,因此超平面S称为分离超平面
、感知机学习就是求得模型参数w,b感知机预测通过学习得到的感知机模型,对于新的输入实例给出其对应的输出类型。
感知机学习策略
数据集的线性可分性:如果存在某个超平面可以把给定数据集完全正确的划分到超平面的两侧,一边为正一边为负,则称数据集为线性可分,否则为不可分。
感知机的学习策略:为了找到超平面,即确定感知机模型参数w,b,需要确定的学习策略就是要定义(经验)损失函数并将损失函数极小化。
感知机学习算法
感知机学习问题转化为求解损失函数式的最优化问题,最优化的方法是随机梯度下降法。
感知机学习算法的原始形式
求参数w,b,使其为损失函数极小化问题的解其中M为误分类点的集合。感知机学习算法是误分类驱动,采用梯度下降法。
算法过程
输入:训练数据集T,学习率
输出:w,b;感知机模型
(1)选取初值 (2)在训练集中选取数据 (3)如果 (4)转至(2),直至训练集中没有误分类点。
算法的收敛性
感知机学习算法的对偶形式
TBC