【斯坦福CS229】机器学习知识框架

今天开始学习斯坦福大学的CS229课程,不想完全照搬讲义,希望能加上自己的理解,新手入门,难免出错,欢迎指正。

第一节课介绍了机器学习的知识框架,CS229只要讲的是机器学习方式中的归纳推理方式,即从足够多的事例中归纳出具有一般性的结论,然后反过来帮助人们解决与具体事例相关的问题,尤其是之前未见过的具体事例。归纳学习是目前机器学习最主要的手段。

根据输入数据的特性不同,归纳学习可以分成四大类:监督学习、无监督学习、半监督学习、强化学习。
监督学习:“输入数据”和“期望输出数据”是已知的,称为“标注”数据。任务是找到输入和输出的对应关系(function),将“实际输出数据”和“期望输出数据”的误差作为评价当前系统性能的标准。
例子:给出“房屋信息”和对应的“房屋价格”的训练数据,预测训练数据之外的房屋的价格
给出“肿瘤体积”和对应的“是否是恶性”的训练数据,预测预测训练数据之外的一个肿瘤是否是恶性

无监督学习:只有输入数据,没有期望输出数据,称为“未标注数据”。任务是找到输入数据的分布规律或者不同部分间的相互联系。
例子:对图像分类、识别图像中的物体

半监督学习:监督学习的数据需要有标注,无监督学习的数据不需要有标注,数据量大时,对数据进行标注是一个负担很重的工作,所以有学者提出了半监督学习。其使用的数据分成两部分:少量的标注数据和大量的未标注数据。其学习过程是先通过学习标注数据得到一个初步的模型,利用模型确定未标注数据的期望输出,将其转变为标注数据,之后通过这部分转化后的数据在进行学习。(试错型学习,可能导致错误的标注,导致学习结果下降)

强化学习:根据输入数据得出的输出,对其进行奖惩,奖惩信息反馈到模型,模型对此作出调整。强化学习强调累计收益,关注一系列决策的结果,而不是每个孤立点的结果。 强化学习来源于自动控制学科,最早主要用于机器人。
例子:机器人、无人驾驶汽车等

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值