Hinton平滑标签

最新推荐文章于 2024-04-18 21:24:24 发布

wangyi4422

最新推荐文章于 2024-04-18 21:24:24 发布

阅读量267

点赞数

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangyi4422/article/details/100504206

版权

1.提要

soft target：是通过计算hard target 的加权平均和标签的均匀分布得到的，而这一步骤称为标签平滑。
作用：模型过拟合，且在很多最新的模型中都得到了应用，比如图片分类、机器翻译和语音识别
论文目的：标签平滑不仅能够提升模型的泛化能力，还能够提升模型的修正能力，并进一步提高模型的集束搜索能力。但在本文的实验中还发现，如果在teacher model 中进行标签平滑，对student model 的知识蒸馏效果会出现下降

2.论文介绍

标签平滑技术在图片分类、语音识别、机器翻译等多个领域的深度学习模型中都取得了很好的效果

文章主要有以下工作：

基于对网络倒数第二层激活情况的线性映射提出了一个全新的可视化方法；

阐释了标签平滑对模型修正的影响，并指出网络预测结果的可信度更多取决于模型的准确率；
展示了标签平滑对蒸馏的影响，并指出该影响会导致部分信息丢失。
标签平滑技术对模型表示的影响与网络结构、数据集和准确率无关。

数学描述：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。