西瓜书笔记Chapter1&2

这篇博客介绍了机器学习领域的两本经典教材——周志华的《机器学习》(西瓜书)和谢文睿的《南瓜书》。西瓜书因避免过于复杂的公式推导而适合初学者,而南瓜书则针对西瓜书中较难理解的公式进行了解析。博主建议初学者不必过早深究西瓜书的公式,待有一定基础后再回看。博客还涵盖了机器学习的基本概念、术语,如数据集、样本、属性和模型,并鼓励读者跟随Datawhale课程系统学习。
摘要由CSDN通过智能技术生成

序言

南瓜书(机器学习公式详解)作者谢文睿老师在南瓜书前言中如此写到:

“周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周老师为了使尽可能多的读 者通过西瓜书对机器学习有所了解, 所以在书中对部分公式的推导细节没有详述,但是这对那些想深究公式推导细节的读者来说可能“不太友好”,本书旨在对西瓜书里比较难理解的公式加以解析,以及对部分公式补充具体的推导细节。”

读到这里,大家可能会疑问为啥前面这段话加了引号,因为这只是我们最初的遐想,后来我们了解到,周老师之所以省去这些推导细节的真实原因是,他本尊认为“理工科数学基础扎实点的大二下学生应该对西瓜书 中的推导细节无困难吧,要点在书里都有了,略去的细节应能脑补或做练习”。所以… 本南瓜书只能算是我 等数学渣渣在自学的时候记下来的笔记,希望能够帮助大家都成为一名合格的“理工科数学基础扎实点的大二下学生”。

对于初学机器学习的小白,西瓜书第1章和第2章的公式强烈不建议深究,简单过一下即可,等你学得有点飘的时候再回来啃都来得及

这本西瓜书是机器学习领域的经典著作,然而要把它啃下来,首先需要坚持,然后需要方法。这次准备好好跟着Datawhale这套课程把这本书涉及的基础打下来。

1. 绪论

1.1 基本概念

  1. 机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。 在计算机系统中, “经验” 通常以 “数据” 形式存在, 因此, 机器学习所研究的主要内容, 是关于在计算机上从数据中产生 “模型” 的算法, 即 “学习算法” 。
  2. 有了学习算法, 我们把经验数据提供给它, 它就能基于这些数据产生模型; 在面对新的情况时, 模型会给我们提供相应的判断。此时,“模型”泛指从数据中学得的结果

1.2 基本术语

数据集(data set): 包含了多个对于对象的描述,其中每个对象称为一个示例(instance)或样本 (sample)。

反映对象某方面性质的事项,称为属性(attribute)或特征(feature),属性上的取值,称为属性值(attribute value)。

属性张成的空间称为属性空间(attribute space)、样本空间(sample space)、输入空间。空间中的每一个点,对应一个坐标向量,因此也可以把一个示例称为一个特征向量(feature vector)。

【这两天有点忙,剩下的笔记明天补上 - 5.17】

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值