认知实习第四天

本文介绍了交叉验证作为数据集划分的方法,通过k折确保模型评估的可靠性。同时,网格搜索针对模型的超参数进行优化,两者结合解决模型训练中的参数调优问题,以手写数字识别为例,展示了如何通过API实现这两种技术的应用。
摘要由CSDN通过智能技术生成

交叉验证

定义:

是一种数据集的分割方法,将训练集划分为 n份,拿一份做验证集 (测试集)、其他n-1份做训练集

原理:

  1. 第一次:把第一份数据做验证集,其他数据做训练

  2. 第二次:把第二份数据做验证集,其他数据做训练

  3. ... 以此类推,总共训练4次,评估4次。

  4. 使用训练集+验证集多次评估模型,取平均值做交叉验证为模型得分

  5. 若k=5模型得分最好,再使用全部训练集(训练集+验证集) 对k=5模型再训练 一边,再使用测试集对k=5模型做评估

网格搜索

定义:

1.模型有很多超参数,其能力也存在很大的差异。需要手动产生很多超参数组合,来训练模型

2.每组超参数都采用交叉验证评估,最后选出最优参数组合建立模型。

组合:

1.交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型

2.网格搜索解决超参数的组合

3.两个组合再一起形成一个模型参数调优的解决方案

交叉验证网格搜索 – API和应用举例

交叉验证网格搜索API介绍:

手写数字识别:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值