P1 机器学习介绍

最新推荐文章于 2022-07-18 11:47:28 发布

万树不会古冬u

最新推荐文章于 2022-07-18 11:47:28 发布

阅读量491

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/RedValkyrie/article/details/105363600

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

一、几个基本问题

机器学习问题中：形象的解释就是你就写段程序，然后让机器人变得了很聪明，他就能够有学习的能力。接下来，你就像教一个婴儿、教一个小孩一样的教他，你并不是写程序让他做到这件事，你是写程序让它具有学习的能力。
机器学习的最终目标：寻找一个function，要让机器具有一个能力，这种能力是根据你提供给他的资料，它去寻找出我们要寻找的function。还有很多关键问题都可以想成是我们就是需要一个function。
supervised learning：告诉机器input和output这就叫做supervised learning
机器学习问题的三个步骤，先找到一个function set，然后再让机器衡量这个function的好坏，最后写一个算法让机器选出最好的function。

二、监督学习(Supervised Learning)概览

< 1 > 常规的监督学习模型

监督学习的问题是我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习，我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得，需要人工的力量把它标注出来，这些function的output叫做label。
在这里插入图片描述

Regression是机器学习的一个task，输出的是一个scalar(标量，数值)
Regression和Classification的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值，在Classification里面机器输出的是类别。
二分类问题和多分类问题：
Model有很多种，机器学习的主要任务是非线性的模型，非线性模型就涉及Deep Learing，做Deep learning时，它的function是特别复杂的，所以它可以做特别复杂的事情。比如它可以做影像辨识，这个复杂的function可以描述pixel和class之间的关系。
除了Deep Learning 以外还有很多Machine Learning的Model也是非线性的模型。

< 2 > 监督学习种的结构化学习(Structured Learning)

在这里插入图片描述
Structured Learning：让机器输出的是要有结构性的，举例来说：在语音辨识里面，机器输入是声音讯号，输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的object。

三、减少Label需要的量的其他学习方法

< 1 > 半监督学习(Semi-supervised Learning)

相对于监督学习，半监督学期可以减少label需要的量，半监含有少量的具有标签的数据，但是具有大量的没有标签的数据，但是这些没有标签的数据也是对学习有帮助的数据
在这里插入图片描述

< 2 > 迁移学习(Transfer Learning)

假设我们要做猫和狗的分类问题，我们也一样，只有少量的有label的data。但是我们现在有大量的data，这些大量的data中可能有label也可能没有label。但是他跟我们现在要考虑的问题是没有什么特别的关系的，我们要分辨的是猫和狗的不同，但是这边有一大堆其他动物的图片还是动画图片（凉宫春日，御坂美琴）你有这一大堆不相干的图片，它到底可以带来什么帮助。这个就是迁移学习要讲的问题。
在这里插入图片描述

< 3 > 无监督学习(Unsupervised Learning)

这个function的输入不知道是什么，可能是某一个code代表要输出图片的特性，输出是一张图片。你给机器看到的只有非常大量的图片，只有function的input，没有output。然后如何让机器无师自通
在这里插入图片描述

< 4 > 强化学习(Reinforcement Learning)

在这里插入图片描述

若将强化学习和监督学习进行比较时，在监督学习中我们会告诉机器正确答案是什么。
Reinforcement Learning里面，我们没有告诉机器正确的答案是什么，机器所拥有的只有一个分数，就是他做的好还是不好。
监督学习是有老师教的。而强化学习是从评价中学习的，也就是从最后的结果做的好还是不好来学习的。

四、总体概览

在这里插入图片描述

< 1 > 蓝色的方块

指的是学习的情景，通常学习的情景是你没有办法控制的。比如，因为我们没有data做监督学习，所以我们才做Reinforcement Learning。比如，因为我们没有data做监督学习，所以我们才做Reinforcement Learning。现在因为Alpha Go比较火，所以Alpha Go中用到的Reinforcement Learning会被认为比较潮。所以说有学生去面试，说明自己是做监督学习的，就会被质疑为什么不做Reinforcement Learning。那这个时候你就应该和他说，如果我今天可以监督学习，其实就不应该做Reinforcement Learning。Reinforcement Learning就是我们没有办法做监督学习的时候，我们才做Reinforcement Learning。

< 2 > 红色的方块

指你的task，你要解的问题，你要解的这个问题随着你用的方程的不同，有regression、有classification、有structured。所以在不同的情境下，都有可能要解这个task。

< 3 > 绿色的方块

指的是不同task里面有不同的method

万树不会古冬u

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
P1 机器学习介绍

一、几个基本问题机器学习问题中：形象的解释就是你就写段程序，然后让机器人变得了很聪明，他就能够有学习的能力。接下来，你就像教一个婴儿、教一个小孩一样的教他，你并不是写程序让他做到这件事，你是写程序让它具有学习的能力。机器学习的最终目标：寻找一个function，要让机器具有一个能力，这种能力是根据你提供给他的资料，它去寻找出我们要寻找的function。还有很多关键问题都可以想成是我们就是需...
复制链接

扫一扫