现阶段对于伪造检测的重难点--泛化

现阶段对于伪造检测的任务,大多数先前工作者提出的模型已经在训练集上达到了很好的性能,但是在未知伪造方法合成的数据集(不包含在训练的集上的数据样本)性能明显下降很多。

为了能够提高模型的泛化能力,我们能做的就是提高样本的多样性,学习伪造方法合成数据集的共性,对于这个问题:

第一种方法就是使用数据增强的方法增加样本的多样性。

第二种方法是混入一定比例的未知数据集的样本。

我观察到,现阶段常用的一些数据增强的方法虽然能够小幅度提升性能,但是跟预期结果还差很多。另外,很多论文中并没有明确表明自己是混入了一定比例的未知数据集的样例,以此来提高自己在泛化能力测试上的性能。

我自己还试过使用随机擦除的方法,一篇比较优秀的论文中提出的方法,但是在我的模型中表现能力并不是很好……

很多论文中,提升模型的泛化能力本质上就是增加样本的多样性……

刺客……

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值