DNN Sparse

最新推荐文章于 2024-09-02 19:54:30 发布

平凡的兵

最新推荐文章于 2024-09-02 19:54:30 发布

阅读量1k

点赞数 1

分类专栏：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chinabing/article/details/50810164

版权

语音识别专栏收录该内容

17 篇文章 1 订阅

订阅专栏

思想的由来：观察的重要性在此体现的玲离尽致。微软那一拨人观察发现DNN模型参数权值很大比例（近70%）小于0.1。有了这个观察结果，他们就开始思考着把这些过小的权值直接置零会如何，如果性能没有太大损失，那就太好了。实验一跑，果不其然。

Sparseness DNN: 大部分参数权值为0的DNN模型；Sparseness DNN优化目标有两个，目标一，最小化交叉熵，目标二，最小化非零参数个数；可以将多目标问题转换为带约束条件的凸优化问题，约束条件就是非零参数个数小于预先设置的阈值。

模型训练：

step1. 正常的CE准则训练（该步之后，权值趋于稳定，简单来说就是幅值大的依然大，幅值小的依旧小）

step2. 基于step1获得的最终模型，设置每层的置零率，如60%，即60%的参数置零；确定每层的置零率后，统计每层的权值门限值，权值在门限值以下置零

step3. 继续进行CE准则训练，并且保持step2制定的sparseness pattern；如何保持？方法一，直接掩蔽为零的权值，即不更新；方法二，将权值在 $(0,min\{\theta/2,0.02\})$ 范围的置0，其中 $\theta$ 为step2计算的权值门限值。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。