第五周深度学习总结

文海傲舟

已于 2022-08-11 10:21:02 修改

阅读量302

点赞数

文章标签：深度学习人工智能计算机视觉

于 2022-08-11 10:14:58 首次发布

本文链接：https://blog.csdn.net/weixin_45551003/article/details/126278108

版权

ShuffleNet

Channel Shuffle Operation

ShuffleNet网络主要创新点在于对于组卷积的重新设计。在传统设计中，网络结构主要受限于昂贵的poingwise卷积，这种 $1 * 1$ 的卷积核在计算量上耗费巨大，为了解决这种问题，以前的网络提出了组卷积(group conv)的方法实现稀疏卷积，这种方法在前面的ResNext中使用过，但这种方法也有副作用，即不同组的通道信息没有关联，如下图a所示。
ChannelShuffle
而如果通过(b)中的设计对每一个group进行再划分，使不同大group中的小组进行shuffle打乱，便可以实现每一个group中的信息连通。

shuffleNet Unit

对于在分组卷积网络中加入channel shuffle模块，以下图中(a)为模板，可以在1*1卷积后加入channel shuffle操作，该模块对于图片尺寸等信息没有改变。
在这里插入图片描述

EfficientNet

网络思路

EfficientNet不同于传统网络设计，以ResNet为例，其通过模块设计增加网络深度来提高网络准确率。但实际中有多个因素可以影响网络准确率，例如深度、宽度和图片输入分辨率等。在投入更多计算资源时如何合理分配这些资源来增加深度、宽度等，以使网络在给定资源的条件下达到最高效率。
于是问题可以转变成一个最优化问题，即定义网络为
Net
在初始配置为 $depth=\alpha, width=\beta, resolution=\gamma$
通过提升提高资源配置使网络达到 $depth=\alpha^{\theta}, width=\beta^{\theta},resolution=\gamma^{\theta}$
我们希望可以使 $A cc u r a cy (N (d, w, r))$ 达到最高，这其中的初始参数depth，width，resolution通过small grip search得到，而 $\theta$ 则是用户指定的系数。

网络结构

EfficientNet_bo

为了使网络在扩展中得到最好性能，我们想要设计一个基准网络，只有基准网络性能够好，其在扩展后的性能才能维持。基准网络结构如下：
EfficientNet_bo

Transformer中的multi-head self-attention

Scaled Dot-Product Attention

在这里插入图片描述
对于输入x进行input Embedding操作得到a，再将x和 $W^{q},W^{k},W^{v}$ 矩阵相乘得到对应q,k,v,这里的W矩阵可以通过学习得到。

之后通过注意力公式

这里 $Q, K, V$ 是对应q,k,v组合起来的矩阵，通过计算可以对应b矩阵，这便是注意力机制的输出。

Multi-Head attention

Multi-Head attention在前面的基础上将其中的每一个q,k,v平分为两个部分，再用类似shuffleNet中的思想将取部分组成一个新的head

最后使用 $MultiHead(Q,K,V)=Concat(head_1,...,head_2)W^{O} where head_i = Attention(QW^{Q}_i,KW^{K}_i,VW^{V}_i)$ 进行拼接

代码练习

VGG猫狗游戏

迁移学习主要使用已有模型的参数进行训练自己的数据，一般需要自己修改最后几层全连接结构。以VGG16为例

model-vgg=torchvision.models.vgg16(pretrained=True)
model_vgg.classifier._modules['6']=torch.nn.Linear(4096,2)
model_vgg.classifier._modules['7']=torch.nn.LogSoftmax(dim=1)

最后训练结果为
在这里插入图片描述

ART艺术鉴赏

通过ResNet18进行迁移学习

model=torchvision.models.resnet18(pretrained=True)
for param in model.parameters():
	param.requires_grad=False
model.fc=torch.nn.Linear(model.fc.in_features,49)
model.to(device)