【机器学习】二、机器学习算法分类及模型评估

最新推荐文章于 2024-10-04 16:37:42 发布

Da_aLi

最新推荐文章于 2024-10-04 16:37:42 发布

阅读量935

点赞数 17

分类专栏：机器学习文章标签：机器学习算法分类

本文链接：https://blog.csdn.net/Da_aLi/article/details/141673661

版权

3 篇文章 0 订阅

订阅专栏

1、算法分类

（1）监督学习

（2）无监督学习

（3）半监督学习

（4）强化学习

输入数据由输入特征值和目标值所组成，具有标准答案

函数的输出可以是一个连续的值（称为回归），或是输出有限个离散值（称为分类）

例如：预测房价，根据样本集拟合一条曲线

例如：根据肿瘤特征去判断良性还是恶性，得到结果是“良性”或是“恶性”，是离散的。

输入数据没有被标记，也没有确定的结果，样本数据类别未知，需要根据样本集的相似性对样本集进行分类（聚类，clustering）视图是雷内差距最小化，类间差距最大化

以上图片，无标签，可以按性别分类，也可按运动类型分类，也可按长发短发分类等等，无标准答案

即训练集同时包含有标记样本数据和未标记样本数据

先将已标记部分的数据进行训练生成模型，然后加入未标记数据再进行训练（目前不是很成熟）

强化学习实质是make decision 问题，及自动化进行决策，且可以连续决策，是一个动态的过程，上一步输出是下一步的输入，主要包含四个元素：agent，环境状态（enviroment），行动（action），奖励（reward）。

	监督学习	强化学习
反馈映射	输入到输出的一个映射，监督式学习输出的是之间的关系，可以告诉算法什么样的输入对应着什么样的输出。	输入到输出的一个映射，强化学习输出的是给机器的反馈reward function，即用来判断这个行为的好坏
反馈时间	做了比较坏的选择会立刻反馈给算法	结果反馈有延时，有时候可能需要走了很多不以后才知道以前某一步的选择是好是坏
输入特征	输入是独立同分布的	面对的输入总是在变化，每当算法做出一个行为，他影响下一次决策的输入
行为模式	不考虑行为间的平衡，只考虑开发	一个agent可以在探索和开发之间做权衡，并且选择一个最大的回报