吃瓜群众【第一章、序论】

最新推荐文章于 2024-07-22 14:29:03 发布

dl_007

最新推荐文章于 2024-07-22 14:29:03 发布

阅读量132

点赞数

分类专栏：吃瓜记录文章标签：机器学习数据挖掘人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dl_007/article/details/124833829

版权

吃瓜记录专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一章序论

1.1 基本术语

数据集
样本
特征
训练
测试

1.2 假设空间

归纳，演绎

1.3 归纳偏好

奥卡姆剃刀原理

第二章模型评估与选择

2.1 经验误差与过拟合

精度（accuracy）= 1-错误率
训练误差（经验误差）：学习器在训练集上的误差
泛化误差：在新样本上的误差
过拟合(overfitting)：学习器把训练样本学得"太好"
欠拟合(underfitting)：对训练样本的一般性质尚未学好

2.2 评估方法

以测试集上的 测试误差 (testing error)作为泛化误差的近似

2.2.1 留出法

在这里插入图片描述

2.2.2 交叉验证法

在这里插入图片描述

2.2.3 自助法

在这里插入图片描述
自助法在数据集较小、难以有效划分训练/测试集时很有用；
在初始数据量足够时，留出法和交叉验证法更常用一些。

2.2.4 调参与最终模型

把训练数据另外划分为训练集和验证集，基于验证集上的性能来进行模型选择和调参

2.3 性能度量

衡量模型泛化能力的评价标准

2.3.1 错误率与精度

精度是分类正确的样本数占样本总数的比例

2.3.2 查准率、查全率与F1

在这里插入图片描述

2.3.3 ROC 与AUC

在这里插入图片描述
AUC (Area Under ROC Curve) ：ROC 曲线下的面积

2.3 .4 代价敏感错误率与代价曲线

2 .4 比较检验

2 .4 .1 假设检验

2 .4 .2 交叉验证t 检验

2.4.3 McNemar 检验

2.4.4 Friedman 检验与N 凹nenyl 后续检验

2.5 偏差与方差

泛化误差可分解为偏差、方差与噪声之和.
在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吃瓜群众【第一章、序论】

第一章序论1.1 基本术语数据集样本特征训练测试1.2 假设空间归纳，演绎1.3 归纳偏好奥卡姆剃刀原理第二章模型评估与选择2.1 经验误差与过拟合精度（accuracy）= 1-错误率训练误差（经验误差）：学习器在训练集上的误差泛化误差：在新样本上的误差过拟合(overfitting)：学习器把训练样本学得"太好"欠拟合(underfitting)：对训练样本的一般性质尚未学好2.2 评估方法以测试集上的测试误差 (testing error)作为泛化误差的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。