（学习笔记）西瓜书-第一章

最新推荐文章于 2022-09-20 17:53:46 发布

理想在哪里

最新推荐文章于 2022-09-20 17:53:46 发布

阅读量733

点赞数 3

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CHOUCHOUC/article/details/109520191

版权

机器学习专栏收录该内容

0 篇文章 0 订阅

订阅专栏

（学习笔记）西瓜书-第一章

基本概念

学习算法：机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”的算法，即“学习算法”

学习算法的作用：

基于提供的经验数据产生模型
面对新情况时，模型可提供相应的判断

属性/特征：反应事件或对象在某方面的表现或性质的事项
样本空间/输入空间：属性张成的空间
n个特征 → n维空间
模型：从数据中学得的结果
学习器：学习算法在给定数据和参数空间上的实例化
标记 → “好瓜/坏瓜”
样例：拥有了标记信息的示例
标记空间/输出空间：标记的集合
泛化能力：学得的模型适用于新样本的能力（训练样本越多可能获得强泛化能力的模型）
假设：学习模型对应了关于数据的某种潜在的规律
真相/真实：这种潜在规律自身，学习过程就是为了找出或逼近真相

归纳（特殊 → 泛化）：具体事实归结出一般性规律
演绎（一般 → 特殊）：从基础原理推演出具体状况

广义的归纳学习：产生“黑箱”模型
狭义的归纳学习：学的概念

假设空间：机器学习中可能的函数构成的空间
版本空间：可能有多个假设与训练集一致，与训练集一致的“假设集合”

归纳偏好：（特征选择）机器学习算法在学习过程中对某种类型假设的偏好

尽可能特殊
尽可能一般

“奥卡姆剃刀”原则：若有多个假设与观察一致，选择最简单的那个
（难点在于怎么确定“简单”？）

“没有免费的午餐”定理：（前提：所有问题出现的机会相同或所有问题同等重要）无论算法“聪明”或“笨拙”，他们的期望性能相同。总误差与学习算法无关。

要谈论算法的相对优劣，必须针对具体的学习问题。

学科之间关系

人工智能 > 机器学习 > 深度学习

机器学习 → 数据分析
云计算 → 数据处理
众包 → 数据标注
机器学习为数据挖掘提供数据分析技术
数据库为数据挖掘提供数据管理技术

假设空间的规模问题

书中例子为西瓜，为判断西瓜的好坏，其属性有三种：色泽、根蒂、敲声。这三种属性分别有3、3、3种可能取值，其假设空间的规模为65。

这是因为，在假设空间中，属性的“无论取什么属性值都合适”也是一种属性值，而不是作为单一属性的3种可能取值的集合存在。

只与色泽有关：3
只与根蒂有关：3
只与敲声有关：3
与根蒂、敲声有关：9
与色泽、敲声有关：9
与色泽、根蒂有关：9
与三者均有关：27
与三者均无关：2（都是好瓜/都是坏瓜）

综上，假设空间规模为65.

理想在哪里

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
（学习笔记）西瓜书-第一章

（学习笔记）西瓜书-第一章基本概念学科之间关系假设空间的规模问题基本概念学习算法：机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”的算法，即“学习算法”学习算法的作用：基于提供的经验数据产生模型面对新情况时，模型可提供相应的判断属性/特征：反应事件或对象在某方面的表现或性质的事项样本空间/输入空间：属性张成的空间n个特征 → n维空间模型：从数据中学得的结果学习器：学习算法在给定数据和参数空间上的实例化标记 → “好瓜/坏瓜”样例：拥有了标记信息的示例标记空间/
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。