各类机器学习算法

最新推荐文章于 2024-07-24 14:05:30 发布

ρ爱上θ

最新推荐文章于 2024-07-24 14:05:30 发布

阅读量1.1k

点赞数

分类专栏：用Python编程和实践深度学习文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/ldy__cwx/article/details/122775852

版权

用Python编程和实践深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

理解监督学习
理解无监督学习
理解强化学习

理解监督学习

首先要理解“监督学习”中的“监督”二字，何为“监督”？监督是指数据中带有的“标签”，通常是对特征的判断，进行类别划分。比如橘子的甜或者不甜，音乐的喜欢或者不喜欢。标签又分数值型标签和“标称型标签”，如果目标变量是标称型的，那么该问题就是分类问题，例如一种药品药效的好与坏，我们可以用数字1代表药效的好，药效的坏用数字0代表，这样 $y_i \in \{0,1\}$ ;如果目标变量是数值型，通常是连续型的，那么该问题通常就是回归问题，例如给定一个药品一段时间的售卖情况，对今后一周该药品的售卖的情况进行预测。综上所述，在监督学习中最后的数据结果是“有迹可循”的，是有目标的，通过使用大量数据，通过计算机对数据进行反复处理，最终能够产生接近正确答案标签的输出值。

理解无监督学习

与监督学习相反，在该类机器学习算法中数据是不会带有标签的，“聚类”是无监督学习的代表性方法（如下图），我们从下图可知改组数据被分为四类，每个颜色代表其中的一类，该类学习算法具有不存在所谓正确与否的答案的特点。
在这里插入图片描述

理解强化学习

实际上，除了监督学习和无监督学习以外，目前受关注较多的机器学习方法还有“强化学习”，在强化学习中也不需要监督，强化学习会提供“智能体”和“环境”。配备好智能体和环境后，智能体会根据环境的变化来采取相应的行动，环境根据行动的结果基于智能体一定的“报酬”，而智能体会根据其获取的报酬来对改行动作出“好”与“坏”的评价，并以此来决定下一次该如何采取行动。例如：围棋AI，象棋AI，机器人的操作和控制等。
在这里插入图片描述

往期文章：

ρ爱上θ

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
各类机器学习算法

文章目录理解监督学习理解无监督学习理解强化学习理解监督学习首先要理解“监督学习”中的“监督”二字，何为“监督”？监督是指数据中带有的“标签”，通常是对特征的判断，进行类别划分。比如橘子的甜或者不甜，音乐的喜欢或者不喜欢。标签又分数值型标签和“标称型标签”，如果目标变量是标称型的，那么该问题就是分类问题，例如一种药品药效的好与坏，我们可以用数字1代表药效的好，药效的坏用数字0代表，这样yi∈{0,1}y_i \in \{0,1\}yi∈{0,1};如果目标变量是数值型，通常是连续型的，那么该问题通常就是
复制链接

扫一扫