训练集、验证集、测试集

小白最近在学栈式降噪自编码(SDAE),过程有三部分:自编码器(AE)的无监督训练、有监督微调、最终正确率的验证。因此需要三部分数据:无标签数据集、少部分有标签的数据集用来微调、大量有标签的数据集用来验证正确率。
一些博客及课本中用的数据集是mnist数据集,但刚才查了下mnist数据集总体上分为两部分:Training set(Training set images+Training set labels)和Test set(Test set images+Test set labels),也就是说SDAE的前两部分用的同一个数据集,初学者有点头大~~
在SDAE中:
训练集:完成对模型参数的训练
验证集:有监督微调(就是把模型从输入到最终输出串起来整体进行训练,得到最终想要的输出数据形式(标签类型的)),其实也就是进阶版的训练
测试集:确定训练好的模型的正确率

数据集的分类主要看算法吧,有监督的算法(比如CNN),分为两部分就好啦(训练+测试),像SDAE这种无监督的算法就需要三部分数据集

小白的第一篇博客,主要是给自己做的笔记,有问题的话随便指出哈,反正我是不会改的哈哈哈哈哈~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值