机器学习三种学习方法和感知器

机器学习三种主要的学习方式:

  1. 监督学习:使用有类标的训练数据构建模型,即在训练过程中,所有的数据都是知道它的类别的。通过构建的这个模型对未来的数据进行预测。在监督学习的下面,又可以分为分类(利用分类对类标进行预测),以及回归(使用回归预测连续输出值)。
  2. 无监督学习:在没有已知输出变量(分类问题中是数据的类标)和反馈函数指导的情况下提取有效信息来探索数据的整体结构。子领域:1.通过聚类发现数据的子群;2,数据压缩中的降维。
  3. 强化学习:构建一个系统,在与环境交互的过程中提高系统的性能。我们可以将强化学习视为与监督学习相关的一个领域。但是强化学习与监督学习不同的是,在强化学习中,并没有一个确定的类标或一个连续类型的值,而是一个通过反馈函数产生的一个反馈值。该反馈值是对当前的系统行为的一个评价。强化学习解决的主要是交互式问题。象棋对弈就是一个常用的强化学习的例子。
    在这里插入图片描述
    感知器由费兰克·罗森布拉特(Frank Rossenblatt)基于MPC神经元模型提出。感知器可以看作一个处理二分类问题的算法。
    在这里插入图片描述
    第一步:得到净输入函数z;z为矩阵X与权值矩阵W的乘积,再加上一个权值偏差得到z:
    在这里插入图片描述
    第二步:通过激励函数得到输出的类标:
    在这里插入图片描述
    第三步,在训练阶段,通过激励函数获得到模型输出的类标y,在将类标与实际类标进行计算得到误差,进行权值更新。进行权值更新是以下的方法更新:
    在这里插入图片描述
    其中:在这里插入图片描述
    η为学习速率,y(i)为第i个样本数据的真实类标,y(i)’为第i个样本预测得出的目标,xj(i)为第i个样本中第j个值。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值