DNS-Keras框架下代码分析

最新推荐文章于 2022-01-25 10:06:35 发布

SrtFrmGNU

最新推荐文章于 2022-01-25 10:06:35 发布

阅读量225

点赞数

分类专栏：深度学习网络压缩

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lin_41/article/details/85726936

版权

深度学习同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

接上一篇：DNS-动态外科手术关键细节理解（结合caffe源码）

从git上也下载了一份关于Keras下将INQ（增量网络量化）与DNS结合的仓库，https://github.com/yaysummeriscoming/DNS_and_INQ

服务器下简单跑了下：

数据集是mnist，网络结构为：

15个epoches，从第三个epoch后开始剪枝，剪枝结果（卷积层--共五层）：

计划初步实现方案参照该版本下的代码，这里先做简单分析：

从主函数看起，第一句就很有意思：

获取当前路径下的Direct后，创建待保存模型路径：

打开NetworkParameters该类：

主要功能是创建4个路径变量，同时创建对应的目录（若没有的话）

接着是超参数部分，

分别是训练的轮次、每批次数量、学习率、学习率衰减因子

以及开始DNS的轮次，gamma值、crate取值（具体的含义见之前对论文的分析）

这里有一个参数的意义不是很理解：batch_scale_factor（批缩放因子）为什么定义这个？

定义测试数据集（数据预处理）：

关于上面的squeeze部分代码，我觉得没必要加了：

分别做了转类型、归一化、类别的独热码设定

构建模型：

这里的CreateModel是一个函数：

首先定义输入的张量，接着判断模型的类型定义是否是DNS（源代码下还有一种关于INQ的操作），接着函数DNSConvBNReluLayer重命名给变量layerType，将DNS的三个参数存放在字典中。

看一下函数DNSConvBNReluLayer：

该函数是对自己重构的DNSConv2D和激活、BN的组合，核心还是自己重构的类DNSConv2D了：

从layers下Convolution2D基类中继承的DNSConv2D：

看一下init方法，几个关于论文中关键参数，以及convolution2D的传入参数

DNSConv2D：该类是自己重定义的一个层，参考以下链接学习如何定义自己的层类【https://blog.csdn.net/DawnRanger/article/details/78307244】

首先是build方法：

build函数目的是对重构的层权重进行创建，一般使用add_weight进行设定，这里设定了迭代数cur_iter值=-1和Mask矩阵（暂时设定为全1）

接着定义了回调函数call，该函数定义重构层的主要功能，首先是卷积的计算，mask矩阵和原来的权重矩阵进行复合，通过调用tf的conv2d函数实现卷积计算，同时判断是否加偏置、加激活层。

此外，最重要的一点：更新mask矩阵，以及更新迭代次数cur_iter。（每做一次卷积计算）此处的K.update(x,New_x)当然指的是使用New_x更新x。

这里要看的DNS_update函数：

配合之前对DNS分析的论文看，上面代码主要工作有：第一句probThreshold是以概率设定掩码矩阵跟新与否的阈值，该阈值随迭代次数推移逐渐变为0（停止更新），第二句代码构建更新T的随机矩阵，注意这里random_num的shape，这里仅和滤波器个数相关，即有多少个filter。

第四句计算均值和标准差，这两个值决定阈值的选取。第9句对mask矩阵进行更新，最后两句表明只有针对DNS迭代次数变化和满足训练阶段才进行。

其他几个方法，start_DNS将迭代计数值定为0，on_batch_end、on_epoch_begin和on_epoch_end则是自定义的回调函数：回调函数（callback）是在调用 fit 时传入模型的一个对象（即实现特定方法

的类实例），它在训练过程中的不同时间点都会被模型调用。它可以访问关于模型状态与性能的所有可用数据，还可以采取行动：中断训练、保存模型、加载一组不同的权重或改变模型的状态。

具体的：

回到主代码中，根据定义的DNSConvBNReluLayer函数（函数式API）将整个网络串联起来。

手写字符训练集，构建的网络较为简单，5层2*2的卷积核堆叠，每层输出通道个数都为16，窄卷积后加入一个softmax分类器。

模型构建完成后，对模型进行编译损失函数为分类交叉熵、优化器使用的是Adam、优化指标选择精度-acc，ModelCheckpoint监控val_loss，每轮过后保存当前权重，后一句始终保存验证集最佳模型。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DNS-Keras框架下代码分析

接上一篇：DNS-动态外科手术关键细节理解（结合caffe源码）从git上也下载了一份关于Keras下将INQ（增量网络量化）与DNS结合的仓库，https://github.com/yaysummeriscoming/DNS_and_INQ服务器下简单跑了下：数据集是mnist，网络结构为：15个epoches，从第三个epoch后开始剪枝，剪枝结果（卷积层--共五层）：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。