有哪些好看的CNN模型画法?

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

编辑:忆臻

本文仅作为学术分享,如果侵权,会删文处理

机器学习算法与自然语言处理报道

有哪些好看的CNN模型画法?

作者:bingo

https://www.zhihu.com/question/62509034/answer/199177562

谢邀。第一次答DL相关题目,如有错误,欢迎指正。

前几天刚好跟同学讨论到画的好看的CNN图,正好答一下问题,自己也做下整理收藏。

说起CNN的模型图,要从经典CNN的相关paper开始:

LeNet,1998年;AlexNet,2012年 ;ZF-net,2013年;NIN,2013年;GoogLeNet (InceptionV1),2014年;VGG,2014年;Batch Norm (InceptionV2),2015年;InceptionV3 ,2015年;ResNet,2015年;InceptionV4,2016年。

依次上图(多图预警):

LeNet

786628849ab75188de6bbceae93676b4.png

AlexNet

33a53fab4b2cb22b485bc1ee3a40c3f6.png

ZF-net

64aa3c81cb2284075cec0f938ccb9bf7.png

NIN

8e0bc8ec0a650559779553e1c4df1b59.png

GoogLeNet

3e368207712dfc5ce91a359b1e471c65.png

VGG

fc8cb7d0b56204e0ae25540bc7b8656d.png

Batch Norm

通用数据预处理,没有提出新的网络模型

InceptionV3

907b6b3e90b7729e78a2e83f2a40bd02.png

ResNet

134fff99db29f575c42ac9d3a29f7752.png

InceptionV4

75fefd03bb3ac38e9c0ad207c87add86.png

在经典的CNN基础上,大家都会根据自己的算法和结构作出一些改进。

个人认为比较好看的CNN结构图:

Andrej Karpathy大神主页(Andrej Karpathy Academic Website)贴出了部分论文的图:

b68251bc7d4ef03fac7be0ab8fc5c1a2.png

Large-Scale Video Classification with Convolutional Neural Networks paper里横向类似Alexnet的图以及纵向多个level的fusion图,与之类似的是另一篇paper里面为了表示各种level pooling做的层级concat的图:

0deaa45cd4f574cb3ac306cef0fefbd5.png

Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的图。

Two-Stream Convolutional Networks for Action Recognition in Videos视频分析经典的Two-stream CNN图:

93b9a3cb0264f9f62eb69be83d631749.png

同样视频分析Limin Wang做了不同改进的视频应用CNN结构图:Limin Wang

最后放一个我们Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition里面的图:

200c69067b9d12980d110fa597639714.png

个人理解和简单总结

根据上面一些经典的CNN结构图和大神们paper里面的CNN模型图,可以看出大家还是在参考经典CNN结构的基础上作出自己的一些变化:例如Cold Start paper模仿ZF-net的图,我们Pooling the Convolutional paper和视频分析的很多paper参考Two-Stream的图,在layer上面进行Fusion以及Pooling通常会参考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation类似的图。

当然除了直接放图之外,VGG还放出了一个表格,清晰的表明每一层的结构和参数。有时候,为了强调自己模型在网络局部的改进,也会有局部区域图出现例如InceptionVX里面卷积核大小不断变化的一系列图,ResNet中shorcut结构:

8b6ed82f4c08d353e5ff6d991f0d6604.png

作者:天机
https://www.zhihu.com/question/62509034/answer/201313069

前两天看到一个高端的。

03678751fd7c484e73bcbcb0dd082cd4.png

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

a061e9d5162a1bf18f4455930cc89566.png

030ba987c0d0e8d46168bfedd88ca503.png

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值