西瓜书学习整理

本文探讨了机器学习中的训练误差,分析了欠拟合和过拟合现象。介绍了评估模型的三种方法:留出法、交叉验证法和自助法,并详细阐述了性能度量,包括错误率、精度、查准率、查全率、F1分数以及AUC和ROC曲线的概念,旨在找到最佳的模型平衡点。
摘要由CSDN通过智能技术生成

西瓜书学习笔记--02

训练误差

欠拟合

  • 训练集与测试集准确度均低,从误差上讲属于偏差大
  • 模型太简单

过拟合

  • 训练集准确度高,测试集准确度低,误差上属于方差大
  • 模型太复杂

评估方法

留出法

  • 将数据集合D划分为互斥的训练集合S和训练集合T
  • S/T的比例一般是7:3,通常将2/3~4/5的样本作为S

交叉验证法

  • 将数据集D划分为互斥的K个子集
  • 每次选取k-1个子集作为训练集合,剩余1个作为测试集合,平均准确度作为评估指标

自助法

  • 采取boosting发法,本质就是有放回抽样,这样保证整个数据集D能够尽可能学习到

性能度量

错误率和精度

  • 对于分类任务: 错误率精度
  • 对于一般数据分布D和概率密度函数p:错误率精度

查准率与查全率

  • 可以参考混淆矩阵:混淆矩阵
    查准率P= T P / ( T P + F P ) TP/(TP+FP) TP/(T
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值