机器学习入门之机器学习算法分类

1、监督学习

输入数据由特征值和目标值所组成,函数输出值可以是一个连续的值(回归问题),也可以是有限个离散值(分类问题)

2、无监督学习

输入数据由输入特征值组成,没有目标值

  • 输入数据没有被标记,也没有确定的结果,样本数据类别未知
  • 需要根据样本间的相似性对样本集进行类别划分

 

3、半监督学习

训练集同时包含有标记样本数据和未标记样本数据

4、强化学习

实质是一个决策问题,即自动进行决策,并且可以做连续决策

监督学习和强化学习对比
 监督学习强化学习
反馈映射输出的是输入和输出之间的关系,可以告诉算法什么样的输入对应什么样的输出输出的是给机器的反馈reward function,即用来判断这个行为是好是坏。
反馈时间做了比较坏的选择会立刻反馈给算法结果反馈有延时,有时候可能需要走了很多步以后才知道以前的某一步的选择是好是坏。
输入特征输入是独立同分布面对的输入总是在变化,每当算法做出一个行为,它影响下一次决策的输入。
算法分类小结
 InOut目的案例

监督学习

(supervised learning)

有标签有反馈预测结果猫狗分类,房价预测

无监督学习

(unsupervised learning)

无标签无反馈发现潜在结构“物以类聚,人以群分”

半监督学习

(Semi-Supervised Learning)

部分有标签,部分无标签有反馈降低数据标记的难度 

强化学习

(reinforcement Learing)

决策流程及激励系统一系列行动长期利益最大化学下棋
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值