Task01：概览西瓜书+南瓜书第1、2章

au1n

已于 2022-03-15 23:39:23 修改

阅读量1.3k

点赞数

分类专栏：啃西瓜文章标签：机器学习

于 2022-03-15 23:38:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45909877/article/details/123514914

版权

啃西瓜专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一章绪论

机器学习：

定义：通过计算，利用经验（以数据的形式存在），改善性能。
主要内容：从数据中产生“模型”的算法（学习算法）
目标：模型适用“新样本”（泛化能力）

1997年，Mitchell给出了一个形式化的定义：

假设用P来评估计算机程序在某任务类T上的性能
若一个程序利用经验E在T中任务上获得了性能改善
则我们就说关于T和P，该程序对E进行了学习

根据训练数据是否有标记信息：

监督学习
- 分类：预测离散值
- 回顾：预测连续值
无监督学习
- 聚类：直接将样本（西瓜，不拥有标记信息）分为若干组（称为“簇”），簇是自动形成的。
  有利于我们了解数据内在规律

第二章模型评估与选择

训练误差（经验误差）：学习器在训练集上的误差
泛化误差：在新样本上的误差

我们最终需要的肯定是泛化误差最小的学习期，但是我们不可能知道新样本是什么样的，所以只能使得经验误差最小
感觉类似于操作系统中，使用LRU来代替OPT

过拟合：

将个体的独特特性，当作了一般特性。
关键障碍（无法彻底避免）

欠拟合：

一般特性尚未学好。
容易克服，加大学习能力

评估方法：对数据集D进行处理，从中产生训练集S和测试集T

留出法
交叉验证法
自助法

性能度量：

错误率与精度
查准率、查全率与F1

参考
《机器学习》周志华著
《机器学习公式详解》谢文睿秦州著

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Task01：概览西瓜书+南瓜书第1、2章

datawhale学习打卡
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。