周志华《机器学习》——绪论：一幅图解释机器学习

最新推荐文章于 2022-03-05 15:59:09 发布

zzmmhxs

最新推荐文章于 2022-03-05 15:59:09 发布

阅读量151

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/zzmmhxs/article/details/114587312

版权

归纳是从具体事实归结出一般性规律，演绎是从基础原理推演出具体状况。

所以机器学习的过程就是一个先根据样例归纳出一般规律，然后通过归纳出的一般规律判断新的样例是哪种情况的过程。

机器学习的过程可以抽象为下图：

其中性能度量参数和代价函数是不一样的。

代价函数是为了从假设空间中选出最好的那个假设，而性能度量参数是为了对比，不同模型提供的不同假设中，哪个假设更好。

不同的方法，代价函数是不一样的，如SVM的代价函数是为了找到最优的w和b，因此是一个w和b的式子；决策树则是为了找到每个节点合适的划分属性是什么，因此代价函数是节点进行样本划分前后“纯度”指标的变化。同一个方法共享同一个代价函数，从而找到在这个方法定义的假设空间中最优的那个。

性能度量参数是为了跨不同方法进行性能度量，每一类任务都有其特定的属性度量，如分类任务常用F1，Precision、Recall；回归任务常用均方误差；聚类任务常用Jaccard系数、FM指数、DB指数、Dunn指数等。通过性能指标度量可以知道不同方法下的不同“最佳模型”，哪个性能更好。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zzmmhxs

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【周志华机器学习】绪论

mikasaaaaa的博客

02-07

1200

第一章绪论机器学习的目标基本术语假设空间归纳偏好 机器学习的目标 机器学习致力于研究如何通过计算的手段，利用经验来玫善系统自身的性能。在计算机中，经验通常以数据形式存在，因此，机器学习研究的主要内容，是关于在计算机上从数据中产生“模型”的算法，即“学习算法”。基本术语假定我们收集了一批关于西瓜的数据，例如(色泽=青绿;根蒂=蜷缩;敲声=浊响)， (色泽=乌黑;根蒂:稍蜷;敲声=沉闷)， (色泽=浅自;根蒂硬挺;敲声=清脆)，……，每对括号内是一条记录，“=”意思是"取值为"。这组记录的集合称为一个

机器学习（周志华）绪论1.2 个人见解

qq_42966160的博客

01-02

549

与使用单个合取式来进行假设表示相比，使用“析合范式”将使得假设空间具有更强的表示能力。若使用最多包含k个合取式的析合范式来表达表1.1西瓜分类问题的假设空间，试估算共有多少种可能的假设。表1.1总共有4个样例，3种属性，属性个数分别为2，3，3，假若考虑没有泛化属性，同时也不考虑空集的前提下，则假设空间总共有种假设，这18种假设的自由组合成的析合范式能够唯一的表示所有的假设，共有种可能，若加...

参与评论您还未登录，请先登录后发表或查看评论

一张图了解机器学习

deephub

10-27

3128

机器学习 机器学习是人工智能(AI)的一种应用，为系统提供无需明确编程就能根据经验自动学习和改进的能力。 机器学习根据不同的任务类型可以分为以下三大类型: 有监督学习无监督学习强化学习有监督学习监督学习是一种机器学习任务，通过训练学习一个函数，该函数根据示例输入-输出对将输入映射到输出。（需要数据标注，输入->输出）在这种类型中，机器学习算法是在标记数据上训练的。尽管这种方法需要准确地标记数据，但在适当的情况下使用监督学习是非常有效的。开始时，系统接收输入数据和输出数据。它的任务是创

[数据挖掘与机器学习] 十张图解释机器学习的基本概念(转自IT面试论坛)

yuxiaoping555的专栏

08-05

2612

在解释机器学习的基本概念的时候，我发现自己总是回到有限的几幅图中。以下是我认为最有启发性的条目列表。 1. Test and training error: 为什么低训练误差并不总是一件好的事情呢：ESL 图2.11.以模型复杂度为变量的测试及训练错误函数。 2. Under and overfitting: 低度拟合或者过度拟合的例子。PRML 图1.4.多项

周志华机器学习—绪论

qq_41821067的博客

09-25

158

基本术语模型：从数据中学习得到的结果，指全局性结果模式：指局部性结果从数据中得到模型的过程称为学习或者训练，训练过程中使用的数据称为训练数据其中的每一个样本称为训练样本，训练样本组成的集合称为训练集某种潜在的规律称为假设样例：例如我们需要判断某一个瓜是否是好瓜，（xi,yi）,yi就是标记，yi的集合称为标记空间分类：我们需要预测的值是离散值，例如是好瓜还是坏瓜，这种学习任务称为分类，如果预测的是连续值，例如西瓜的成熟度，这种学习任务是回归。两个类别分类的是正类，其他则是反类。多个类别是多分类

【机器学习 周志华】1.绪论

weixin_38435875的博客

06-18

329

1.1 引言 机器学习所研究的主要内容，是关于在计算机上从数据中产生“模型”的算法，即“学习算法（learning algorithm）”。有了学习算法，我们把经验数据提供给它，它就能基于这些数据产生模型；在面对新的情况时，模型会给我们提供相应的判断。如果说，计算机科学是研究关于“算法”的学问，那么类似的，可以说机器学习是研究关于“学习算法”的学问。本书用“模型”泛指从数据中...

周志华 机器学习 1 绪论

weixin_40599519的博客

07-27

150

周志华《机器学习》自学总结+Python实现之——序言+如何使用本书+绪论

Lucas_Lee_的博客

07-14

305

序言这部分提出了针对机器学习的6个问题和对应的思考： 1. 对符号学习和统计学习地位的解读，相关学者认为未来统计学习的方法应当强调与知识或者认知的结合，从而实现螺旋上升； 2.机器学习的“样本同分布”假设是否可以被突破？或许迁移学习可以解决这个问题； 3.深度学习并非是机器学习的新方向，其兴起是由于计算力的提高； 4.机器学习需要更高深的数学理论去推动； 5.离散方法和连续方法之间的联系需要进一步的数学理论支撑； 6.大数据对机器学习方法背后的数理统计方法有没有发生本质的变化，其对机器学习的

【超详细！】周志华《机器学习》西瓜书小白Python学习笔记（二）————第三章线性模型（对数几率回归）附课后题3.3详解

River_J777的博客

04-13

2792

【超详细！】周志华《机器学习》西瓜书小白Python学习笔记（二）——第三章线性模型（对数几率回归）附:课后题3.3详解回顾与前言第三章线性模型对数几率回归课后习题3.3 回顾与前言在上一篇博客中，我们通过小明习得“买瓜秘笈”的故事了解了机器学习的大概流程以及一些相应的基本术语。在接下来的文章中，我们将开始学习具体的机器学习算法啦！学习什么知识模型都是一个从简到难的过程。很多时候未知的...

机器学习(1):绪论

远行的舟

04-24

2729

原文链接：机器学习(1):绪论 | 远行的舟参考文献：① 周志华. 机器学习[M]. 北京:清华大学出版社. 2016.01. ② 李航. 统计学习方法[M]. 北京:清华大学出版社. 2012.03. 周志华教授在其所著《机器学习》一书中将机器学习定义为：一门致力于研究如何通过计算的手段，利用数据来改善系统自身性能的学科。同时周教授指出：机器学习主要研究从数据中产生模型的算法，即学习算...

一图看懂所有机器学习概念

喜欢打酱油的老鸟

08-19

643

一图看懂机器学习

喜欢打酱油的老鸟

03-11

344

《机器学习》周志华 第1章绪论

m0_37757740的博客

11-04

386

机器学习：（形式化定义）假设用P来评估计算机程序在某类任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能的改善，则我们就说关于T和P，该程序对E进行了学习。理解：P是指标，T是任务，程序利用了以往的经验E来提升性能，这就是该程序对E进行了学习模型：全局性的结果（一颗决策树）模式：局部性结果（一条规则）样本（记录）：关于一个事件或对象的描述，反映的是该事件或者对象在某...

周志华《机器学习》笔记：第1章绪论

科研糖

08-09

795

机器学习绪论：引言、基本术语、假设空间、归纳偏好。

机器学习（周志华）书章节导图（持续更新中...)

weixin_46847902的博客

03-05

544

机器学习（周志华）书的章节导图

介绍机器学习基本概念（七张图）

jelek的专栏

03-21

951

主要涉及机器学习一些基本概念：偏差与方差权衡，避免过度拟合，贝叶斯推论奥卡姆原则，特征组合，非线性偏差函数和其他以图片方式展示的概念。 Deniz Yuret, Feb 2014. 我发现当我试图解释基本的机器学习概念时，总会涉及到同样的少数图片。下方是一些我非常想阐明的图。 1.偏差（bias）VS 方差权衡（variancetradeoff） 2.避免过度拟合（overfitti

十张图解释机器学习的基本概念

qq_42537397的博客

06-25

306

在解释机器学习的基本概念的时候，我发现自己总是回到有限的几幅图中。以下是我认为最有启发性的条目列表。 1. Test and training error:为什么低训练误差并不总是一件好的事情呢：ESL 图2.11.以模型复杂度为变量的测试及训练错误函数。 2. Under and overfitting:低度拟合或者过度拟合的例子。PRML 图1.4.多项式曲线有各...

机器学习模型性能评估（二）：P-R曲线和ROC曲线

机器学习算法那些事

11-09

4419

上文简要介绍了机器学习模型性能评估的四种方法以及应用场景，并详细介绍了错误率与精度的性能评估方法。本文承接上文，继续介绍模型性能评估方法：P-R曲线和ROC曲线。 2.2 查准率、查全率与F1 错误率和精度虽然常用，但是不能满足特定的任务的需求。以西...

机器学习算法解析：最小描述长度准则

"这篇文档是关于机器学习算法的总结，特别是介绍了最小描述长度准则，它是一种数据解释的原则，类似于奥卡姆剃刀原理。文档提到了贝叶斯分析，并用信息论中的概念来阐述最短假设的选择。同时，文档还列出了机器学习...