机器学习算法分类

根据数据集不同,可以吧机器学习算法分为:

监督学习

无监督学习

半监督学习

强化学习


1、监督学习
●定义:
输入数据是由输入特征值和目标值所组成。
■函数的输出可以是一个连续的值(称为回归),
■或是输出是有限个离散值(称作分类)
 

 

 2、无监督学习
●定义:
    输入数据是由输入特征值组成。
    输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类, clustering) 试图使类内差距最小化,类间差距最大化。

3、半监督学习.
半监督学习:即训练集同时包含有标记样本数据和未标记样本数据。

 4、强化学习
    强化学习:实质是,make decisions问题,即自动进行决策,并且可以做连续决策。
    举例:
    小孩想要走路,但在这之前,他需要先站起来,站起来之后还要保持平衡,接下来还要先迈出一条腿,是左腿还是右腿,迈出一步后还要迈出下一步。
    小孩就是agent,他试图通过采取行动(即行走)来操纵环境(行走的表面),并且从一个状态转变到另-个状态(即他走的每- -步),当他完成任务的子任务(即走了几步)时,孩子得到奖励(给巧克力吃),并且当他不能走路时,就不会给巧克力。
     主要包含四个元素: agent, 环境状态,行动,奖励;

 上一步数据的输出是下一步数据的输入

 


 

 

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值