【斯坦福CS229】机器学习知识框架

最新推荐文章于 2022-05-29 11:12:48 发布

AlphaBoys

最新推荐文章于 2022-05-29 11:12:48 发布

阅读量1.7k

点赞数 4

分类专栏： CS229 文章标签：斯坦福大学机器学习吴恩达 CS229 笔记

本文链接：https://blog.csdn.net/lulu_life/article/details/52727502

版权

CS229 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

今天开始学习斯坦福大学的CS229课程，不想完全照搬讲义，希望能加上自己的理解，新手入门，难免出错，欢迎指正。

第一节课介绍了机器学习的知识框架，CS229只要讲的是机器学习方式中的归纳推理方式，即从足够多的事例中归纳出具有一般性的结论，然后反过来帮助人们解决与具体事例相关的问题，尤其是之前未见过的具体事例。归纳学习是目前机器学习最主要的手段。

根据输入数据的特性不同，归纳学习可以分成四大类：监督学习、无监督学习、半监督学习、强化学习。
监督学习：“输入数据”和“期望输出数据”是已知的，称为“标注”数据。任务是找到输入和输出的对应关系（function），将“实际输出数据”和“期望输出数据”的误差作为评价当前系统性能的标准。
例子：给出“房屋信息”和对应的“房屋价格”的训练数据，预测训练数据之外的房屋的价格
给出“肿瘤体积”和对应的“是否是恶性”的训练数据，预测预测训练数据之外的一个肿瘤是否是恶性

无监督学习：只有输入数据，没有期望输出数据，称为“未标注数据”。任务是找到输入数据的分布规律或者不同部分间的相互联系。
例子：对图像分类、识别图像中的物体

半监督学习：监督学习的数据需要有标注，无监督学习的数据不需要有标注，数据量大时，对数据进行标注是一个负担很重的工作，所以有学者提出了半监督学习。其使用的数据分成两部分：少量的标注数据和大量的未标注数据。其学习过程是先通过学习标注数据得到一个初步的模型，利用模型确定未标注数据的期望输出，将其转变为标注数据，之后通过这部分转化后的数据在进行学习。(试错型学习，可能导致错误的标注，导致学习结果下降)

强化学习：根据输入数据得出的输出，对其进行奖惩，奖惩信息反馈到模型，模型对此作出调整。强化学习强调累计收益，关注一系列决策的结果，而不是每个孤立点的结果。强化学习来源于自动控制学科，最早主要用于机器人。
例子：机器人、无人驾驶汽车等