机器学习中的训练集、验证集和测试集

 在机器学习中我们把数据分为测试数据训练数据

测试数据就是测试集,是用来测试已经训练好的模型的泛化能力。

训练数据常被划分为训练集(training set)验证集(validation set),比如在K-折交叉验证中,整个训练数据集D,就被分为K个部分,每次挑选其中的(K-1)部分做训练集,剩下的部分为验证集。

训练集是用来训练模型或确定模型参数的,如ANN中权值,CNN中的权值等;验证集是用来做模型结构选择,确定模型中的一些超参数,比如正则项系数,CNN各个隐层神经元的个数等;

 以下是维基百科中的解释:

  • Training set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier.

  • Validation set: A set of examples used to tune the parameters [i.e., architecture, not weights] of a classifier, for example to choose the number of hidden units in a neural network.

  • Test set: A set of examples used only to assess the performance [generalization] of a fully specified classifier.

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值