机器学习中训练集、验证集、测试集的定义和作用

下面是一些定义及作用:
Training set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier.
训练集是用来学习的样本集,通过匹配一些参数来建立一个分类器
Validation set: A set of examples used to tune the parameters [i.e., architecture, not weights] of a classifier, for example to choose the number of hidden units in a neural network.
验证集是用来调整分类器的参数的样本集,比如在神经网络中选择隐藏单元数。验证集还用来确定网络结构或者控制模型复杂程度的参数
Test set: A set of examples used only to assess the performance [generalization] of a fully specified classifier.
测试集纯粹是为了测试已经训练好的模型的分类能力的样本集。

一般验证集在交叉验证里应用的比较多:
利用交叉验证方法选择模型思路是:使用训练集(trainset)数据所有候选模型进行参数估计,使用验证集(validationset)为检验样本,然后计算预测均方误差,比较各个模型的预测均方误差,选择预测均方误差最小的拟合模型为选择模型。
 

转载于:https://www.cnblogs.com/june0507/p/7600912.html

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值