西瓜书读书笔记——第一章 绪论

西瓜书读书笔记——第一章 绪论

周教授在本文的开头描写了一个生活中常见的情景作为引子,点明了一个观点:特征+经验=预测结果。这是我们人类用来解决问题的常见方法。由人类迁移到计算机,那么计算机如何使用这个观点来进行预测呢?这就是机器学习的核心内容。在计算机系统中,经验常以数据的形式存在。因此,机器学习所研究的主要内容,就是在计算机上产生模型的算法。所谓的模型,也就是一堆函数,输入的数据经过这个函数,输出的结果即是我们想要的答案。机器学习的关键,就是在于找出这个函数,即产出模型。有了模型,我们就可以把它当作经验,从而解决其他类似的问题。

基本术语

以周教授所举的买西瓜为例:

数据集:一堆描述西瓜的数据集合

示例/样本:数据集中的每条记录,这些记录是关于一个事件或对象(这里指西瓜)的描述

属性/特征:反映事件或对象在某方面的表现或特征

属性值:属性的取值

属性空间/样本空间/输入空间:属性所张成的空间,例如色泽,根蒂,敲声作为三个坐标轴,建立的坐标系可以使每一个西瓜都落在坐标上。

特征向量:每一个点都对应一个向量,所以我们也把每一个示例称为特征向量

其他的概念描述地较为清晰,请读者自行阅读西瓜书了解

监督学习与无监督学习的区别在于人为提供标注好的数据的多少

监督学习的两大任务是回归和分类,他们的区别在于回归得到的是一堆数字,而分类得到的是类别,二分类任务,比如要求判断好坏;多分类任务,则是要求我们分出较多的类别。

泛化指的是模型能解决多种问题,通俗点讲就是模型比较灵活,既能算加法也能算乘法。

后面的内容对于初学者来讲没有必要了解的那么清楚,如看不懂也不要灰心,在学过一段时间后回头看这些内容可以帮助我们更好的理解,可以暂时先跳过。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值