机器学习笔记-2.模型评估与选择之评估方法

本文介绍了模型评估的三种常用方法:留出法、交叉验证法和自助法。留出法是直接划分训练集和测试集,但需多次试验取平均值以提高稳定性。交叉验证法通过k次划分和测试,返回k次结果的均值,更准确但计算开销大。自助法通过有放回抽样创建新的数据集,适合小数据集,但可能改变样本分布。
摘要由CSDN通过智能技术生成

学习内容

  • 评估方法
  • 评估指标
  • 比较检验

一. 评估方法

理想:通过评估学习器的泛化误差,选出泛化误差最小的模型。

实际:泛化误差只能通过测试求得的测试误差来近似。

从总样本集 D 中产生训练集 S 和测试集 T,往往有以下三种常见方法:留出法、交叉验证法、自助法。

1. 留出法

【留出法】直接将数据集 D 划分为两个互斥的集合,即 D =S \cup T,S \cap T=ΦΦ。

比如上图,红色部分为训练集,绿色部分为测试集,两部分互斥。 

注意
1. 训练 / 测试集的划分要尽可能保持数据分布的一致性。比如分层采样,保持样本类别的比例相似。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值