模型选择与训练集、验证集、测试集

问题描述:

在学习模型设计完成后,对模型进行训练,可得到模型参数 θ ,通过假设函数公式:
在这里插入图片描述

可得到预测值。

但怎么知道训练完成的模型性能怎么样呢?也就是说,通过该模型得到的预测值准不准确?有没有办法提高准确度?

这就是本节将要解决的问题。

模型选择与训练集、验证集、测试集

在这里插入图片描述
如图所示,将原始数据以 6:2:2 分成 3 份。
分别为:训练集、交叉验证集、测试集

训练集:训练模型,获得参数 θ
交叉验证集: 获取模型其他最优参数。比如:模型多项式的次数,正则化时参数 λ,学习率 α,等等可以提高模型预
测准确度的除 θ 外的参数。
测试集:在其他参数调整好后,测试系统预测的准确度。

需要注意的是:
1 在对公式进行正则化避免过拟合问题时,交叉验证集与测试集是不需要正则化的(λ == 0),这 3 个集仅仅是训练数据不同,模型(公式)是相同的。
2 使用交叉验证集寻找最优参数时,得到的 Jcv 是一个 n*1 维的向量(例如寻找模型次数时,使d = 1:10,则 n = 10),可以使用可视化找出最优参数。也可以使用 matlab 函数 min(X) 直接得到最小值,但 d = 9 与 d = 10 所得的 Jcv 大小差别不大,但计算量却增加很多(增加了 x^10 项),因此建议从图像中找最优参数。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值