机器学习西瓜书
文章平均质量分 62
学习笔记
盛寒
初来乍到,请多多关照~
展开
-
机器学习(西瓜书)学习笔记导览
本篇文章会持续更新直到更新完毕,关注博主不迷路~(如果没有超链接,表示还没有更新到)原创 2024-02-27 20:39:42 · 545 阅读 · 0 评论 -
3.1 基本形式 机器学习
从本章本节开始就开始正式介绍机器学习的算法了!我们首先登场的是---------线性模型。原创 2024-04-10 15:17:08 · 388 阅读 · 1 评论 -
2.5 偏差与方差
可以说从数学角度上阐释了欠拟合和过拟合的情况。原创 2024-04-10 15:12:52 · 211 阅读 · 0 评论 -
2.4 比较检验 机器学习
接我们的上一篇《性能度量》,那么我们在某种度量下取得评估结果后,是否可以直接比较以评判优劣呢?实际上是不可以的。因为我们第一,测试性能不等于泛化性能,第二,测试性能会随着测试集的变化而变化,第二,很多机器学习算法本身有一定的随机性,即便用相同参数设置在同一测试集上其结果也会不同所以直接选取相应评估方法在相应度量下比大小的方法不可取。原创 2024-03-28 14:16:11 · 1436 阅读 · 0 评论 -
2.3 性能度量
对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是.性能度量反映了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果;这意味着模型的“好坏”是,什么样的模型是好的,不仅取决于算法和数据,还决定于.在预测任务中,给定样例集D= {(1,31),(2,32),. . . , (m, Jm)},其中 yi是示例ax;的真实标记.要评估学习器的性能,就要把学习器预测结果f(z)与真实标记y进行比较。原创 2024-03-17 19:00:11 · 915 阅读 · 0 评论 -
2.2 评估方法 机器学习
我们若有一个包含m个样例的数据集,若我们既需要训练,也需要测试,我们该如何处理呢?原创 2024-03-06 19:51:38 · 1308 阅读 · 0 评论 -
2.1 经验误差与过拟合 机器学习
但是倘若一个学习器在训练样本上几乎完美,那么这是否是一个我们需要的模型呢?实际上,这样的模型往往不是我们所需要的。因为请注意,我们所需要的是在新样本下依然能良好适配的学习器。在训练样本上训练过好的学习器,很有可能把训练模型的自身特性当成了我们的普遍存在的所有潜在样本的一般性质。当我们遇到新样本时,倘若我们的学习器过拟合,会把叶子上的锯齿误认为叶子的普遍特征,这样就导致没有锯齿的叶子不是树叶。显然,我们需要泛化误差较小的模型。通常我们把分类错误的样本数占样本总数的比例称为。相应的,1-a/m称为。原创 2024-03-05 10:45:42 · 688 阅读 · 0 评论 -
1.4 归纳偏好 机器学习
若仅有表1.1中的训练样本,则无法断定上述三个假设中哪一个“更好”.然而,对于一个具体的学习算法而言,它必须要产生一个模型.这时,学习算法本身的“偏好”就会起到关键的作用.例如,若我们的算法喜欢“尽可能特殊”的模型,则它会选择“好瓜→(色泽= *)∩(根蒂=蜷缩)∩(敲声=浊响)”;通过学习得到的模型对应了假设空间中的一个假设.于是,西瓜版本空间给我们带来一个麻烦:现在有三个与训练集一致的假设,但与它们对应的模型在面临新样本的时候,却会产生不同的输出.例如,对(色泽=青绿;“什么样的模型更好”原创 2024-02-29 11:20:09 · 577 阅读 · 0 评论 -
1.3 假设空间 机器学习
即能够将训练集中的瓜判断正确的假设.假设的表示一旦确定,假设空间及其规模大小就确定了。注意,我们的假设空间包括色泽,根,敲声的所有不同排列和组合,当然包括没有出现在数据集中的组合。需注意的是,现实问题中我们常面临很大的假设空间,但学习过程是基于有限样本训练集进行的,因此,可能有多个假设与训练集一致,即。我们在假设空间中进行搜索,搜索过程中可以不断删除与正例不一致的假设、和(或)与反例一致的假设.最终将会获得。从特殊到一般的“泛化”过程,即从具体的事实归结出一般性规律。的假设,这就是我们学得的结果.原创 2024-02-29 08:27:08 · 491 阅读 · 0 评论 -
1.2 基本术语 机器学习
例如“浅色瓜”“深色瓜” ,甚至“本地瓜”“外地瓜”.这样的学习过程有助于我们了解数据内在的规律,能为更深入地分析数据建立基础.需说明的是,在聚类学习中,“浅色瓜”“本地瓜”这样的概念我们事先是不知道的,而且;是希望通过对训练集进行学习,建立一个从输入空间 x到输出空间Y的映射f :X->Y.对二分类任务,通常令Y= {-1,+1}或{0,1};例如我们把“色泽”“根蒂” “敲声” 作为三个坐标轴,则它们张成一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置。原创 2024-02-27 20:37:28 · 853 阅读 · 0 评论