【Python/Pytorch - 网络模型】-- 手把手搭建3D VGG感知损失模型

在这里插入图片描述
文章目录

00 写在前面

感知损失:对于提升图片的肉眼可见细节,效果十分明显;对于一些指标如(SSIM、PSNR)这些,效果不明显。

在01中,可以根据3D VGG的网络结构,进行模块化编程,主要包括VGG3D模块。

在模型调试过程中,可以先通过简单测试代码,进行代码调试。

01 基于Pytorch版本的3D VGG代码

# 库函数调用
import torch
import torch.nn as nn

# VGG3D模块
class CustomVGG3D(nn.Module):
    def __init__(self, in_channels=3, out_channels=2):
        super(CustomVGG3D, self).__init__()
        self.features = nn.Sequential(
            nn.Conv3d(in_channels, 64, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.Conv3d(64, 64, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),
            nn.Conv3d(64, 128, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.Conv3d(128, 128, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),
            nn.Conv3d(128, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.Conv3d(256, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.Conv3d(256, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            nn.Conv3d(256, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            nn.ReLU(inplace=True),
            # nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),
            # nn.Conv3d(256, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            # nn.ReLU(inplace=True),
            # nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            # nn.ReLU(inplace=True),
            # nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            # nn.ReLU(inplace=True),
            # nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),
            # nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            # nn.ReLU(inplace=True),
            # nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            # nn.ReLU(inplace=True),
            # nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),
            # nn.ReLU(inplace=True),
            # nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),
        )
        self.classifier = nn.Sequential(
            nn.Linear(512 * 8 * 8 * 1, 4096),
            nn.ReLU(True),
            nn.Linear(4096, 4096),
            nn.ReLU(True),
            nn.Linear(4096, out_channels),
            nn.Sigmoid()
        )

    def forward(self, x):
        x = self.features(x)
        # x = x.view(x.size(0), -1)
        # x = self.classifier(x)
        return x

# 测试代码
# if __name__ == '__main__':
#     x = torch.ones([2, 4, 256, 256, 32])
#     model = CustomVGG3D(in_channels=4, out_channels=1)
#     f = model(x)
#     print(f)

02 论文下载

Very deep convolutional neural network based image classification using small training sample size
arXiv: VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值