李宏毅老师机器学习2020学习笔记与思考（一）Introduction

最新推荐文章于 2024-04-08 15:13:39 发布

佐MYH

最新推荐文章于 2024-04-08 15:13:39 发布

阅读量185

点赞数 1

分类专栏：李宏毅课程笔记分享文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_45574006/article/details/112376103

版权

5 篇文章 0 订阅

订阅专栏

机器学习是什么->自动寻找函数

例：

Supervised Learning 监督学习
监督学习需要训练集训练，训练前需要labeling处理，训练的过程期待机器通过各种方式，找到loss最小的的函数。以围棋为例，监督学习需要教给机器每一步怎么走，然后机器通过既定的学习进行test data的处理。
Semi-supervised Learning 半监督学习
部分数据有标签部分数据没有标签，相较于监督学习成本低，但是准确度比较高。
Unsupervised Learning 无监督学习
无标签，通过数据之间的内在联系和相似性将他们分成若干类——聚类。根据数据本身的特性，从数据中根据某种度量学习出一些特性。
Reinforcement Learning 强化学习
强化学习类似于半监督学习，通过很多步最终得到一个reward，在reward的反馈下，机器可以知道学习过程中的问题。以围棋为例，强化学习过程中机器first move->second move->…->last move—>win!(reward)通过最后win这个结果，来反思自己每一步的问题并进行学习。

先给定一个函数范围，通常为线性(linear)或network architechture(RNN CNN等)，然后在这个范围内，寻找函数，寻找的过程最常见的是Gradient Descent(梯度下降法)。

关注