机器学习笔记(四) 感知机

       感知机是一个二分类的线性分类模型,即在特征空间中将实例划分为正负两类的分离超平面,是判别模型。感知机是神经网络和支持向量机的基础。

· 模 型

       感知机是如下函数来表示的输入空间到输出空间:

其中, wb为感知机的模型参数,w为权值向量而b为偏置。

       感知机的几何解释是线性方程将特征空间划分为两个部分,那么位于这两个部分的实例分别被分为正负两类。


· 学习策略

      感知机学习的目的是根据训练数据集求得一个将正负实例点完全正确分开的分离超平面。那么学习的过程就是确定一个学习策略来选择模型参数wb,即定义损失函数并将损失函数极小化。

      感知机的损失函数是误分类点到超平面的总距离。首先,输入空间任一点到超平面距离为那么误分类点到超平面的距离即为。所以,对于误分类点的集合M,其到超平面的总距离为


       感知机的损失函数即为:

·  学习算法

       感知机学习算法是误分类驱动的,求解的目标为具体的,采用随机梯度下降法不断极小化损失函数。
      其中损失函数的梯度:

       算法步骤:①  任意选取一个超平面

                           ②  随机选取误分类点

                           ③  如果,那么采用梯度下降法,更新模型参数:

                           ④  转第二步直至训练集没有误分类点。


·  对偶形式

       对偶形式的基本想法就是,将模型参数wb表示为实例的线性组合形式,然后通过求解其系数来求得wb
       已知在学习过程中不断通过来更新wb,那么设修改了n次,wb关于的增量分别为

       最后学习的wb就可以表示为:


       对表示第i个实例点由于误分而进行更新的次数。实例点更新次数越多,意味着它距离超平面越近,也就越难分类正确,这些实例点对学习结果影响最大。

       一方面,感知机学习算法存在无穷多解,其解会由于不同的初值或不同的迭代顺序而可能不同。另一方面,感知机是不能表示异或的,这是因为a和b的异或结果 a XOR b ,异或的结果可以表示为:


      可以看出,从数据集线性可分性的角度证明XOR逻辑是非线性的,所以不能被感知机表示。


参  考

    李航《统计学习方法》






  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网络搜索,并极大地提高了人类基因组的认识。在本课中,将学习最有效的机器学习技术,并获得实践,让它们为自己的工作。更重要的是,不仅得到理论基础的学习,而且获得那些需要快速和强大的应用技术解决问题的实用技术。最后,会学到一些硅谷利用机器学习和人工智能的最佳实践创新。本课程提供了一个广泛的介绍机器学习、数据挖掘、统计模式识别的课程。主题包括: (一)监督学习(参数/非参数算法,支持向量机,核函数,神经网络)。 (二)无监督学习(聚类,降维,推荐系统,深入学习推荐)。 (三)在机器学习的最佳实践(偏差/方差理论;在机器学习和人工智能创新过程)。 本课程还将使用大量的案例研究,您还将学习如何运用学习算法构建智能机器人(感知,控制),文本的理解(Web 搜索,反垃圾邮件),计算机视觉,医疗信息,音频,数据挖掘,和其他领域。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值