监督学习(Supervised Learning)(吴恩达老师课程笔记)

上一篇我们大概学习了机器学习基本概念,这一节将了解监督学习

定义

        监督学习是一种从x到y,或者说是从输入到输出映射的一种算法,也就是说,通过分析一系列给定的输入和正确的输出,机器学习算法可以在我们只给出输入的情况下,对输出进行和合理准确的预测和猜测。

例子

监督学习实例
输出处理分析输出
邮件垃圾邮件过滤器是否是垃圾邮件
音频语音识别系统转换后的文字
汉语机器翻译英语
广告信息+个人信息在线广告平台是否点击广告
图像+其他传感器自动驾驶汽车

其他汽车位置(以便绕过

其他汽车)

手机等的图片目视检查是否存在裂痕等瑕疵

类别

回归(Regression)

        下面是监督学习的另一个例子,现在我们已知一部分房子的房价和面积,(红色的×),那我们怎么知道一个没有出现过的房屋面积(比如750)对应的房价呢?我们会去用线段拟合已知xy数值对,然后再取x为750,得到对应的y,但是我们所拟合的直线不同,得到的结果也是不同的。我们的机器学习算法就是期望找到一个计算方法来得到最准确最合理的y值。这种类型的监督学习我们也叫它回归(Regression)。

        回归(Regression)就是从无限多可能的数字中预测一个更为合理的数字,房价例子中,面积是750时,房价可能是150,150.1,160……,我们就是要从这无限多个数字中选择一个最合适最准确的值。

8a9bb69ae47643f0b7d073aa58d320c2.png

分类(Classification)

        用一个肿瘤检测问题作为分类的例子,假如我们正在构建一个方便医生检测肿瘤的机器学习系统,我们输入患者的医疗记录,机器学习系统会尝试去判断着个肿瘤是不是恶性的,是否会发生癌变。我们可以给出一系列已知的数据,比如用这种格式:

输入输出(0:良性 1:恶性)
肿瘤状态10
肿瘤状态21
肿瘤状态31
肿瘤状态40
…………

        那么我们应该可以得到这样一个图(x是肿瘤的状态,或者大小,纵坐标代表是否是恶性肿瘤)

1a019a206f0245b1835fc54990f71e9d.png

       

        在这样的情况下,显然我们想要的得到的结果无非就是0或者1,良性或者恶性,这与前面所讲的回归是不一样的。我们说回归是从无限多可能的数字中选择一个,而这里的分类是要求我们从有限个可能输出中选择一个。

        对于上面的图像我们也可以用另外一种方式来表示

bfd36038b6804d828db36704589d8009.png

        蓝色圆圈表示良性的,红色×表示恶性的,假如横坐标仍然为肿瘤的大小,那么如果一个病人的肿瘤大小已知,我们便可以依据之前的数据来对肿瘤情况进行预测。

        当然,输入也可以是很多个,比如肿瘤的例子,输出也是年龄+肿瘤大小,这样的话就可以得到下面这张图,有病人来了之后,医生依据病人的年龄和肿瘤的大小可以给出更为准确的结果。

09976a4d8f2b4877b7839a41e1b82646.png

        tips:分类的专业术语中,output class和output category是经常互换使用的。

        分类是预测类别,类别不一定是数字,比如预测一张图片是小猫还是小狗,也可以预测肿瘤是良性还是恶性,当然也可以是数字,重点在于可能的输出是有限的。

总结

        监督学习是从x到y的映射,机器学习算法从正确的输入输出中学习(Learns from being ge)

        监督学习主要分为回归(regression)和分类(classification),回归是从无限多可能的结果中预测一个结果,而分类是从有限个结果中预测一个结果。

  • 26
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值