pytorch学习六--模型创建步骤与nn.module

模型模块包括两部分:模型创建与权值初始化;模型创建又包括构建网络层(卷积层、池化层、激活函数层等)和拼接网络层(LeNet、AlexNet、ResNet等);权值初始化有Xavier、Kaiming、均匀分布、正态分布等。

 

LeNet网络结构

运算示意图

nn.module

  • torch.nn.Parameter:张量子类,表示可学习参数,如weight、bias
  • torch.nn.Module:所有网络层基类,管理网络属性
  • torch.nn.functional:函数具体实现,如卷积、池化、激活函数等
  • torch.nn.init:参数初始化方法
  • parameters:存储管理nn.Parameter类
  • modules:存储管理nn.Module类
  • buffers:存储管理缓冲属性,如BN层中的running_mean
  • ***_hooks:存储管理钩子函数
self._parameters = OrderedDict()
self._buffers = OrderedDict()
self._backward_hooks = OrderedDict()
self._forward_hooks = OrderedDict()
self._forward_pre_hooks = OrderedDict()
self._state_dict_hooks = OrderedDict()
self._load_state_dict_pre_hooks = OrderedDict()
self._modules = OrderedDict()

nn.module总结:

  1. 一个module可以包含多个子module
  2. 一个module相当于一个运算,必须实现forward()函数
  3. 每个module都有8个字典管理它的属性

模型容器与AlexNet构建

Containers

  • nn.Sequential:按顺序包装多个网络层
  • nn.ModuleList:像python的list一样包装多个网络层
  • nn.ModuleDict:像python的dict一样包装多个网络层

nn.Sequential是nn.module的容器,用于按顺序包装一组网络层

Sequential的特性:

  • 顺序性:各网络层之间严格按照顺序构建
  • 自带forward():自带的forward里,通过for循环依次执行前向传播运算

nn.ModuleList是nn.module的容器,用于包装一组网络层,以迭代方式调用网络层的主要方法:

  • append():在ModuleList后面添加网络层
  • extend():拼接两个ModuleList
  • insert():指定在ModuleList中位置插入网络层

nn.ModuleDict是nn.module的容器,用于包装一组网络层,以索引方式调用网络层主要方法:

  • clear():清空ModuleDict
  • items():返回可迭代的键值对(key-value pairs)
  • keys():返回字典的键(key)
  • values():返回字典的值(value)
  • pop():返回一对键值,并从字典中删除

nn.Sequential:顺序性,各网络层之间严格按照顺序执行,常用于block构建

nn.ModuleList:迭代性,常用于大量重复网构建,通过for循环实现重复构建

nn.ModuleDict:索引性,常用于可选择的网络层

 

AlexNet

AlexNet:2012年以高出第二名10多个百分点的准确率获得ImageNet分类任务冠军,开创了卷积神经网络的新时代

AlexNet特点如下:

  1. 采用ReLU:替代饱和激活函数,减轻梯度消失
  2. 采用LRN(Local Response Normalization):对数据归一化,减轻梯度消失
  3. Dropout:提高全连接的鲁棒性,增加网络的泛化能力
  4. Data Augmentation:TenCrop,色彩修改

参考文献:ImageNet Classification with Deep Convolutional Neural Networks

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要搭建一个基于PyTorch的LSTM-Attention模型,可以按照以下步骤进行: 首先,导入所需的库: ```python import torch import torch.nn as nn ``` 然后,定义模型类: ```python class LSTMAttentionModel(nn.Module): def __init__(self, input_size, hidden_size, output_size): super(LSTMAttentionModel, self).__init__() self.hidden_size = hidden_size # 定义LSTM层 self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True) # 定义Attention层 self.attention = nn.Linear(hidden_size, 1) # 定义输出层 self.fc = nn.Linear(hidden_size, output_size) def forward(self, input): # LSTM层前向传播 output, _ = self.lstm(input) # Attention层前向传播 attention_weights = torch.softmax(self.attention(output), dim=1) attention_output = torch.sum(output * attention_weights, dim=1) # 输出层前向传播 output = self.fc(attention_output) return output ``` 在上述代码中,我们定义了一个名为`LSTMAttentionModel`的模型类。在初始化函数中,我们定义了LSTM层、Attention层和输出层。在前向传播函数中,我们首先通过LSTM层获取输出,然后使用Attention层计算注意力权重,并将注意力权重与LSTM输出相乘得到注意力输出。最后,我们将注意力输出传入输出层,得到最终的模型输出。 注意:上述代码仅为搭建LSTM-Attention模型的基本框架,具体的输入维度、隐藏层维度和输出维度等需要根据实际任务进行调整。同时,还可以根据需要添加其他层或修改模型结构。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值