神经网络算法中什么是训练集,什么是测试集?以及其各对应的作用?本人新手,望高手指
机器学习中训练集、验证集、测试集的定义和作用到底是什么样的?
下面是一些定义及作用:Trainingset:Asetofexamplesusedforlearning,whichistofittheparameters[i.e.,weights]oftheclassifier.训练集是用来学习的样本集,通过匹配一些参数来建立一个分类器Validationset:Asetofexamplesusedtotunetheparameters[i.e.,architecture,notweights]ofaclassifier,forexampletochoosethenumberofhiddenunitsinaneuralnetwork.验证集是用来调整分类器的参数的样本集,比如在神经网络中选择隐藏单元数。
验证集还用来确定网络结构或者控制模型复杂程度的参数Testset:Asetofexamplesusedonlytoassesstheperformance[generalization]ofafullyspecifiedclassifier.测试集纯粹是为了测试已经训练好的模型的分类能力的样本集。
一般验证集在交叉验证里应用的比较多:利用交叉验证方法选择模型思路是:使用训练集(trainset)数据所有候选模型进行参数估计,使用验证集(validationset)为检验样本,然后计算预测均方误差&#