深度学习01(西瓜书)

文章讨论了模型评估中的经验误差和过拟合现象,特别是在手写体识别问题上的应用。介绍了训练集、测试集的划分方法,如留出法、交叉验证法和自助法,以及它们各自的特点和适用场景。此外,文章还提到了性能度量,包括错误率、精度、均方误差以及查准率和查全率在回归和分类任务中的作用。
摘要由CSDN通过智能技术生成
  • 模型评估与选择

     

2.1经验误差与过拟合:概念明确的问题,假设手写体问题,m个样本数据,比如有1000张手写体照片,Y样本正确的结果,使用模型评估,对照片进行分析,正确的话就返回Y 如果有a个错误

基本数据

rate错误率: E=a/m 

accurary精度:1-E

error误差:|Y-Y'|

2.2训练集和测试集(训练集验证集和测试集)

泛化能力(预测能力)

  • :模型对没有见过的数据的预测能力,
  • 训练集 VS 测试集

trainning set训练集 :三个方法 =留出法+交叉验证法+自助法

留出法:简单的三七分,二八分 将少部分的数据留出给验证集合

(或者也可以进行多次随机划分,训练出多个模型,最后取平均值)

交叉验证法:k折交叉验证

(意思就是把数据一次缩减一折,分成多少个数据集,最后就是一个数据集合,不推荐时间长)

自助法:假设一个样本集有m=10个 我们随机选择里面其中一个 选择十个作为测试集合

那么我们假如里面那个数字是n 那么选到n的概率就是1/n,没被选择的概率就是(1-1/n)有m次就是(1-1/n)的m次方 那么当m趋于无穷的时候就是1/e  =0.368(约等)

重点:

没被选到的数字就是测试集适用于数据较小且难以划分,缺点就是改变初始数据集的分布有误差

validation验证集:

  • 调参数很多参数是认为规定的
  • 比如三个参数,每个参数5个候选值 对于一个训练集/测试集就有5*3=125(幂)模型需要
  • 调参数就会加入一个数据集,验证集合
  • 训练集训练,验证集看结果,调参数再往返

2.3性能度量{具体公式}

  • 回归任务最常用的就是均方误差:预测值与真实值的差方总求和/总数。
  • 如果每个数出现的概率不同那么在每一个差方值前加权就是乘出现的概率值

错误率:见名知意 在总数据中错误的占总的比值

查准率查全率:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Truswei

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值