pytorch学习之nn模块

最新推荐文章于 2024-01-29 13:18:42 发布

正在进步的小李

最新推荐文章于 2024-01-29 13:18:42 发布

阅读量136

点赞数

分类专栏： pytorch框架文章标签： pytorch 学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72955351/article/details/131761559

版权

pytorch框架专栏收录该内容

9 篇文章 0 订阅

订阅专栏

nn模块

卷积层

`1d/2d/3d/convolution`

卷积运算：卷积核在输入信号（图像）上滑动，相应位置上进行乘加

卷积核：又称为滤波器，过滤器，可认为是某种模式，某种特征

卷积过程类似于用一个模板去图像上寻找与它相似的区域，与卷积核模型越相近，激活值越高，从而实现特征提取

卷积维度：一般情况下，卷积核在几个维度上滑动，就是几维卷积

`nn.Conv2d`

功能：对多个二维信号进行二维卷积

主要参数：

in_chanels：输入通道数
out_channels：输出通道数，等价于卷积核个数
kernel_size：卷积核尺寸
stride：步长
padding：填充个数，通常是保持输入输出的特征分辨率保持不变
dilation：空洞卷积大小，常用于图像分割任务，提高感受野
groups：分组卷积设置
bias：偏置

卷积过程中权值一般一个4维的形状，但是最后为什么做的是2维卷积？

一般查看权值的形状的时候，通常都是shape(c1, c2, c3, c4)

c1输出的维度，有多少卷积核输出就是多少
c2 输入的维度
c3、c4卷积核的大小

输入的图像通常是RGB形式，因为会创建3个卷积核，分别在不同的维度上面进行卷积，然后卷积的值相加，最后加上偏置，得到特征图

转置卷积

用于对图像进行上采样

假设图像尺寸为4*4，卷积核为3*3，paddin=0，stride=1

正常卷积
首先将图片拉成一个16*1的向量，这个1代表的是一张图片，然后3*3的卷积自动补零变成16，因为输入是4*4，所以卷积核是4*16，相乘得一个4*1，再reshape变成2*2
转置卷积
和上面一样，先拉成一个16*1的向量，卷积核因为输出是一个4*4，但是输入是一个2*2特征图，因为卷积核的大小是16*4，最后输出的就是一个16*1，然后在reshape变成4*4

pytorch也自带转置卷积的函数

nn.ConvTranspose2d功能：转置卷积实现上采样

主要参数：

in_channel：输入通道数
out_channel：输出通道数
kernel_size：卷积核尺寸
stride：步长
padding：填充个数
dilation：空洞卷积大小
groups：分组卷积设置
bias：偏置

但是转置卷积会出现棋盘效应，是因为不均匀卷积导致的，且转置卷积是不可逆的

池化层

池化运算：对信号进行“收集”并“总结”，类似水池收集水资源，因而得名池化层

“收集”：多变少 “总结”：最大值/平均值

`nn.MaxPool2d`

功能：对二维信息（图像）进行最大值池化

主要参数：

kernel_size：池化核尺寸
stride：步长
padding：填充个数
dilation：池化核间隔大小
ceil_mode：尺寸向上取整
return_indices：记录池化像素索引

`nn.AvgPool2d`

功能：对二维信息（图像）进行平均值池化

主要参数：

kernel_size：池化核尺寸
stride：步长
padding：填充个数
ceil_mode：尺寸向上取整
count_include_pad：填充值用于计算
divisor_override：除法因子

`nn.MaxUnpool2d`

功能：对二维信号（图像）进行最大值池化上采样

主要参数：

kernel_size：池化核尺寸
stride：步长
padding：填充个数

线性层

线性层又称全连接层，其每个神经元与上一层所有的神经元相连接，实现对前一层的线性组合，线性变换

`nn.Linear`

功能：对一维信号（向量）进行线性组合

主要参数：

in_features：输入结点数
out_features：输出结点数
bias：是否需要偏置

激活函数层

激活函数对特征进行非线性变换，赋予多层神经网络具有深度的意义

`nn.Sigmoid`

特性：

输出值在（0,1），符合概率分布
导数范围是[0, 0.25]，易导致梯度消失
输出为非0均值，破坏数据分布

`nn.tanh`

特性：

输出值在（-1,1），数据符合0均值
导数范围（0,1），易导致梯度消失

`nn.ReLU`

特性：

输出值均为正数，负半轴导致神经元坏死
导数是1，缓解梯度消失，但容易引发梯度爆炸

正在进步的小李

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
pytorch学习之nn模块

pytorch模块创建nn模块学习记录
复制链接

扫一扫

专栏目录

正在进步的小李 CSDN认证博客专家 CSDN认证企业博客

码龄2年

20: 原创

138万+: 周排名

167万+: 总排名

1464: 访问

: 等级

221: 积分

1: 粉丝

0: 获赞

13: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

语法学习（一）
CSDN-Ada助手: 恭喜您写了第三篇博客！标题为“语法学习（一）”。您的坚持和创作热情令人钦佩。在这篇博客中，您似乎开始探索语法学习的奥秘，这是一个非常重要的主题，对于提高语言表达能力至关重要。接下来，我建议您可以继续深入探讨语法学习的其他方面，例如不同语法规则的应用场景、常见语法错误的纠正方法等。谦虚地说，我相信您对语法学习有更多独到见解。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
VGG网络
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题为“VGG网络”，看来您对深度学习的研究和实践非常扎实。在这篇博客中，您对VGG网络进行了详尽的介绍，为读者提供了宝贵的知识。不过，如果我可以提供一些建议的话，或许您可以在下一篇博客中探讨一下VGG网络在图像分类任务中的应用案例，这将进一步丰富您的内容，使读者更好地理解和应用VGG网络。期待您未来更多的博客创作，谢谢您的分享！
GooLeNet V1 网络学习
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题中的“GooLeNet网络学习”引起了我的兴趣。您对网络学习的深入研究令人敬佩。在下一步的创作中，或许您可以考虑加入一些实例或案例，以便更好地说明GooLeNet在网络学习中的应用。我相信您的谦虚态度将会让您不断进步，期待您未来更多的精彩博文！
GoogleNet V2
CSDN-Ada助手: 恭喜你撰写了第11篇博客，标题为“GoogleNet V2”！你的持续创作精神令人钦佩。在这篇博客中，你提到了GoogleNet的第二版，这无疑是一个引人注目的主题。下一步，我建议你可以进一步探索GoogleNet V2的创新之处，比如其在图像识别领域的应用以及与之前版本的对比。同时，也可以讨论一下GoogleNet V2相对于其他深度学习模型的优势和不足之处。期待你在未来的创作中继续保持谦虚态度，为读者带来更多有价值的内容！
GoogLeNet V3
CSDN-Ada助手: 恭喜您撰写了第12篇博客，题为“GoogLeNet V3”。您对于持续创作的热情令人钦佩，这表明您对该主题的深入理解和扎实的知识储备。在接下来的创作中，我建议您考虑探讨一些与GoogLeNet V3相关的实践案例或者对该模型的进一步改进。期待在您的博客中继续学习到更多有价值的知识。谦虚的态度将使您的博客更具魅力，同时也会吸引更多读者的关注。加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。