152是指152次卷积
其中block共有3+8+36+3 = 50个
每个block是由3层卷积构成的bottle_net block.共150个卷积
开头一个卷积将3通道的图片提取特征。
后面一个nn.AdaptiveAvgPool2d((1,1)), 就是自适应平均池化,输出维度为1.
因为本来上面的各层卷积后输出的还是一个二维矩阵。图中的64,128等都是通道数,也就是二维矩阵的个数。最后要通过自适应池化将卷积最后的矩阵转换称一个1维的数。
然后才能用线性层进行维度映射。进行分类。
resnet用于不同的任务中,前面的提取特征部分都是一样的,知识后面的池化+线性部分,也就是决策器,不同。
用于图像分类、识别、跟踪、分割