CNN训练加速

最新推荐文章于 2023-06-13 22:34:36 发布

HGGshiwo

最新推荐文章于 2023-06-13 22:34:36 发布

阅读量323

点赞数

分类专栏： python 文章标签： cnn 深度学习 tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HGGshiwo/article/details/119343016

版权

python 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

卷积加速 Bottleneck Layers

ref:https://blog.csdn.net/kobbbb/article/details/89741210

Bottleneck，瓶颈，顾名思义，输入和输出通道数保持，但是在中间进行卷积时，将通道数缩小从而达到减少参数的目的，可以看一下下面这段Keras代码

from keras.layers import Conv2D
# given that conv1 has shape (None, N, N, 128)
conv2 = Conv2D(96, (1, 1), ...)(conv1) # squeeze
conv3 = Conv2D(96, (3, 3), ...)(conv2) # map
conv4 = Conv2D(128, (1, 1), ...)(conv3) # expand

如果直接通过一个12833的卷积层，那么需要的参数个数是12833128=147456，进行Bottleneck后的参数个数为1281196+963396+9611128=107520，可以看到，参数个数减少了4w多个。当前一些著名网络都有使用这种方法，像ResNet和DenseNet等等。

通过这个方法，我的learnable parameter从40w个减少到了9w个，同时误差从0.021上升到了0.03

遗憾的是，训练时间并没有显著减少, 反而有所增加。我的猜测是参数虽然减少，但是网络收敛变慢，因此误差和准确度都下降了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CNN训练加速

卷积加速 Bottleneck Layersref:https://blog.csdn.net/kobbbb/article/details/89741210Bottleneck，瓶颈，顾名思义，输入和输出通道数保持，但是在中间进行卷积时，将通道数缩小从而达到减少参数的目的，可以看一下下面这段Keras代码from keras.layers import Conv2D# given that conv1 has shape (None, N, N, 128)conv2 = Conv2D(96, (
复制链接

扫一扫

专栏目录

HGGshiwo CSDN认证博客专家 CSDN认证企业博客

码龄5年

296: 原创

7万+: 周排名

5650: 总排名

66万+: 访问

: 等级

5483: 积分

458: 粉丝

575: 获赞

137: 评论

2236: 收藏

私信

关注

热门文章

分类专栏

最新评论

DDPM对于噪声的理解
xiehbpku: 扩散过程中因为噪声epsilon是随机的，所以xt是随机变量，这个过程通过重采样技巧，你得到了训练样本(x0,epsilon,xt)，这些都是常量，用来训练unet， xt的本质不过是x0和噪声的线性插值；去噪过程给定噪声样本xt，使用unet计算去噪值，注意这是对真实epislon的一个估计值（因为网络参数是在均方误差下估计的），进而根据x0与xt的插值关系得到x0的估计值，这个估计值由于跳过了很多步因此variance是很大的，尤其当xt噪声污染度越高（即步越大）时x0估计值的variance就越大，所以论文中给出的预测过程就是一个渐进性估计x0：在第t步得到epsilon估计值后进而公式计算x0的估计值，然后根据x0估计值和xt，进而公式计算xt-1的均值的估计值，xt-1的方差是常数不用估计，这里就可以采样得到xt-1了（多样性生成），然后用依此迭代。逆向过程中当t很大时，是不可能恢复出原始图像的，即使在渐进性去噪过程不进行随机采样。
VAE论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
RISC-V模拟器 Rimulator
干锅土鸡: 开源吗
6-1 Numerical Summation of a Series (40分)
programmecantrun: 想问一下第二条公式（第一个长公式）一个Σ拆分成两个Σ是怎么做到的呀
django使用fetch上传文件
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。