图像处理中的深度卷积神经网络

最新推荐文章于 2024-03-30 22:00:15 发布

To_be_thinking

最新推荐文章于 2024-03-30 22:00:15 发布

阅读量612

点赞数

分类专栏：深度学习入门到放弃

本文链接：https://blog.csdn.net/To_be_to_thought/article/details/104378311

版权

深度学习入门到放弃专栏收录该内容

6 篇文章 0 订阅

订阅专栏

输出尺寸（ $o_h$ , $o_w$ ）与输入尺寸（ $n_h$ , $n_w$ ）、核尺寸（ $k_h$ , $k_w$ ）、padding（ $p_h$ , $p_w$ ）和stride（ $s_w$ , $s_h$ ）的关系
$o_h=(n_h+p_h-k_h+s_h)/s_h \\ o_w=(n_w+p_w-k_w+s_w)/s_w$
这里的 $p_h$ , $p_w$ 表示两侧padding的和，即在单侧padding $p_h/2$ , $p_w/2$

LeNet

在这里插入图片描述

LeNet
    Data:MNIST
    Input:(batch_size,1,28,28)
    1st Conv:    kernel=6*5*5    pad=2    stride=1  -----> (28+4-5+1)/1=28    output.shape=(batch_size,6,28,28)
    Sigmoid
    1st AvgPool: kernel=2*2      pad=0    stride=2  -----> (28+0-2+2)/2=14    output.shape=(batch_size,6,14,14)
    2st Conv:    kernel=16*5*5   pad=0    stride=1  -----> (14+0-5+1)/1=10    output.shape=(batch_size,16,10,10)
    Sigmoid
    2st AvgPool: kernel=2*2      pad=0    stride=2  -----> (10+0-2+2)/2=5     output.shape=(batch_size,16,5,5)
    Flatten: feature_map展成向量长度16*5*5=400   (batch_size,400)
    1st FC:  权重矩阵400*120                     (batch_size,120)
    2st FC:  权重矩阵120*84                      (batch_size,84)
    3st FC:  权重矩阵84*10                       (batch_size,10)

AlexNet

在这里插入图片描述

AlexNet
    Data：ImageNet
    Input:(batch_size,3,224,224)        kernel.shape=(n_channel,width,height)
    1st Conv:    
        kernel=96*11*11 pad=0    stride=4  -----> (224+0-11+4)/4=28  (batch_size,96,54,54)
    Relu
    1st MaxPool: 
        kernel=3*3      pad=0    stride=2  -----> (54+0-3+2)/2=26    (batch_size,96,26,26)
    2nd Conv:    
        kernel=256*5*5  pad=2    stride=1  -----> (26+4-5+1)/1=26    (batch_size,256,26,26)
    Relu
    2nd MaxPool: 
        kernel=3*3      pad=0    stride=2  -----> (26+0-3+2)/2=12    (batch_size,256,12,12)
    3rd Conv:
        kernel=384*3*3  pad=1    stride=1  -----> (12+2-3+1)/1=12    (batch_size,384,12,12)
    Relu
    4th Conv:
        kernel=384*3*3  pad=1    stride=1  -----> (12+2-3+1)/1=12    (batch_size,384,12,12)
    Relu
    5th Conv:
        kernel=384*3*3  pad=1    stride=1  -----> (12+2-3+1)/1=12    (batch_size,384,12,12)
    Relu
    3rd MaxPool:
        kernel=3*3      pad=0    stride=2  -----> (12+0-3+2)/2=5     (batch_size,384,5,5)
    Flatten: feature_map展成向量长度384*5*5=9600   (batch_size,9600)
    1st FC:  权重矩阵9600*4096                     (batch_size,4096)
    Relu
    Dropout
    2st FC:  权重矩阵4096*4096                     (batch_size,4096)
    Relu
    Dropout
    3st FC:  权重矩阵4096*1000                     (batch_size,1000)

VGG

在这里插入图片描述

NiN

在这里插入图片描述

GoogLeNet

在这里插入图片描述

GoogLeNet:
    Data:Fashion-MNIST
    Input: (batch_size,1,96,96)
    1st Conv: kernel=64*7*7   pad=3    stride=2  -----> (96+6-7+2)/2=28    feature_map.shape=(batch_size,64,48,48)
    Relu
    1st MaxPool: kernel=3*3   pad=1    stride=2  -----> (48+2-3+2)/2=24    feature_map.shape=(batch_size,64,24,24)
    2nd Conv: kernel=64*1*1   pad=0    stride=1  -----> (24+0-1+1)/1=24    feature_map.shape=(batch_size,64,24,24)
    Relu
    3rd Conv: kernel=192*3*3  pad=1    stride=1  -----> (24+2-3+1)/1=24    feature_map.shape=(batch_size,192,24,24)
    Relu
    2nd MaxPool: kernel=3*3   pad=1    stride=2  -----> (24+2-3+2)/2=12    feature_map.shape=(batch_size,192,12,12)
    1st Inception:
        line 1:
            Conv: kernel=64*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,64,12,12)
        line 2:
            Conv: kernel=96*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,96,12,12)
            Conv: kernel=128*3*3 pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,128,12,12)
        line 3:
            Conv: kernel=16*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,16,12,12)
            Conv: kernel=32*5*5  pad=2  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,32,12,12)
        line 4:
            MaxPool: kernel=3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,192,12,12)
            Conv: kernel=32*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,32,12,12)
    2st Inception:
        line 1:
            Conv: kernel=128*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,128,12,12)
        line 2:
            Conv: kernel=128*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,128,12,12)
            Conv: kernel=192*3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,192,12,12)
        line 3:
            Conv: kernel=32*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,32,12,12)
            Conv: kernel=96*5*5  pad=2  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,96,12,12)
        line 4:
            MaxPool: kernel=3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,256,12,12)
            Conv: kernel=64*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,64,12,12)
    3rd MaxPool: kernel=3*3   pad=1    stride=2  -----> (12+2-3+2)/2=12    feature_map.shape=(batch_size,480,12,12)
    3rd Inception:
        line 1:
            Conv: kernel=192*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,192,12,12)
        line 2:
            Conv: kernel=96*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,96,12,12)
            Conv: kernel=208*3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,208,12,12)
        line 3:
            Conv: kernel=16*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,16,12,12)
            Conv: kernel=48*5*5  pad=2  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,48,12,12)
        line 4:
            MaxPool: kernel=3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,480,12,12)
            Conv: kernel=64*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,64,12,12)
    4th Inception:
        line 1:
            Conv: kernel=192*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,192,12,12)
        line 2:
            Conv: kernel=96*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,96,12,12)
            Conv: kernel=208*3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,208,12,12)
        line 3:
            Conv: kernel=16*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,16,12,12)
            Conv: kernel=48*5*5  pad=2  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,48,12,12)
        line 4:
            MaxPool: kernel=3*3  pad=1  stride=1  -----> (12+2-3+1)/1=12    feature_map.shape=(batch_size,480,12,12)
            Conv: kernel=64*1*1  pad=0  stride=1  -----> (12+0-1+1)/1=12    feature_map.shape=(batch_size,64,12,12)

Inception

在这里插入图片描述

To_be_thinking

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
图像处理中的深度卷积神经网络

typora-root-url: img输出尺寸（oho_hoh,owo_wow）与输入尺寸（nhn_hnh,nwn_wnw）、核尺寸（khk_hkh,kwk_wkw）、padding（php_hph,pwp_wpw）和stride（sws_wsw,shs_hsh）的关系oh=(nh+ph−kh+sh)/show=(nw+pw−kw+sw)/swo_h=(n_h+p_...
复制链接

扫一扫

专栏目录