吴恩达机器学习1.3 监督学习----详细笔记及心得

      在给出正式的监督学习的定义之前,吴先讲解了一个例子,房价预测,具体如图所示:其中横轴表示的是不同平方英尺数的房子,纵轴是不同房子的价格
房价预测
假如朋友有一套750平方英尺的房子,他想卖掉,能卖多少钱。学习算法可以帮我们模拟一条直线,然后估计750时,房价大约是150k,但是如果我们模拟的是二次曲线,那么房价可以卖到200k,那应该选择直线模拟还是二次函数拟合数据,哪种方式都不会让房子卖得好,这就是监督学习的例子。

      监督学习是指我们给这个算法一个数据集,其中包含了正确答案,也就是说我们给它一个房价数据集,在这个中剧中的每一个样本,我们都给出正确的价格,即这个房子实际卖价格。算法的目的就是给出更多正确的答案。
更专业的术语:也被称为回归问题,是指我们想要预测连续的数值输出,(房价),技术上,房价是个离散值,通常认为是个实数,标量,连续值。
      另外一个监督学习的例子:
监督学习例子
预测乳腺癌是恶性的还是良性的,横坐标是肿瘤的尺寸,纵坐标是0或者1,yes or no,
例子
      如果有5个良性的,有5个恶性的样本,那么问肿瘤大小为紫色箭头所示大小时,是良性还是恶性,那么这就转换成了分类问题,有时分类可以分为三类四类。
      然后用一条线表示恶性和良性,如下图:
例子

      即将上图的数据集对应画下来,这个例子只是用了一个特征属性进行了分类,其他的机器学习中,会有多个特征,多个属性,有个例子,假如我们不仅仅肿瘤的大小,我们还知道病人的年龄,这种情况下,数据集应该如下:
多个属性

      假设年龄和肿瘤大小分别处在如图所示的位置,那么我们会在数据上画出一条直线设法将良性和恶性分开。这个例子就是两个特征,肿块大小和年纪,其他的学习算法中会有很多特征,那么怎么处理无穷多的特征呢,会溢出,那么可以用支持向量机,允许计算机处理无穷多的特征。
      最后有一个问题,如下图,假如你开了一家公司,你想要开发学习算法来处理两个问题,
问题
      那么应该选择C选项,第一个问题数值比较大,是实数,可以看出连续性问题,而第二个问题样本比较少,是分类问题。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值