![](https://img-blog.csdnimg.cn/7044e80644d046f495e9e009ba13e7d5.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
图像分类
文章平均质量分 71
该专栏主要涉及机器学习、深度学习的图像分类方法,其中包括经典的分类网络,也会不断更新前沿的分类方法。
湫兮之风
这个作者很懒,什么都没留下…
展开
-
VGG不收敛的问题
原文的代码的复现是没有BN层,而现在以torch训练不加BN是无法收敛的。在卷积后面加个BN归一化特征范围。原创 2024-03-23 21:13:53 · 140 阅读 · 0 评论 -
VGG介绍及Pytorch实现
VGG是一种经典的卷积神经网络架构,由牛津大学视觉几何组(Visual Geometry Group)提出。VGG以其简单而有效的设计而闻名,其核心思想是通过多层深度的卷积和池化层来逐渐提取图像特征,并且通过堆叠多个卷积层和池化层来增加网络的深度。VGG网络结构中主要采用3x3大小的卷积核和2x2大小的最大池化核,这种统一的设计使得网络架构非常规整,易于理解和实现。VGG网络共有多个版本,其中VGG16和VGG19是最为常用的两个版本,分别包含16和19个卷积层,以及若干个全连接层。原创 2024-03-23 21:10:59 · 349 阅读 · 0 评论 -
CBAM解析及代码(Pytorch)
CBAM,全称Convolutional Block Attention Module,是一种注意力机制模块,用于增强卷积神经网络(CNN)的特征表达能力。该模块由通道注意力模块和空间注意力模块两部分组成,能够分别关注输入特征图的通道信息和空间信息,进而提升模型对于重要特征的关注度。在通道注意力模块中,CBAM通过全局平均池化和最大池化操作捕获通道间的依赖关系,生成两个通道描述子。这两个描述子随后通过共享的全连接层和ReLU激活函数进行变换,再经过Sigmoid函数得到通道注意力权重。原创 2024-03-23 21:04:27 · 1381 阅读 · 0 评论 -
ResNet介绍及pytorch实现
Resnet的原理与pytorch代码介绍原创 2023-11-10 15:18:48 · 172 阅读 · 0 评论 -
图像分类数据集
该博客介绍一些常用图像分类数据集及其链接原创 2023-11-10 14:06:32 · 112 阅读 · 1 评论 -
经典注意力网络: SeNet及pytorch实践
先看输入特征数据其中代表卷积运算后输出通道的特征数据,代表通道的输入数据,代表个输入通道为的卷积核。由于输出是通过所有通道的求和产生的,因此通道依赖关系隐式嵌入在中,但这些依赖关系与过滤器捕获的空间相关性纠缠在一起。全局注意力可以对整张特征图的每个像素点的关系进行建模,那么同样特征图通道之间也存在联系。SeNet通过显式建模通道相互依赖性来实现这一目标,以便在将卷积核响应馈送到下一个变换之前,分两个步骤(挤压和激励)重新校准滤卷积核响应。压缩与激励模块。原创 2023-11-10 11:28:40 · 278 阅读 · 1 评论 -
AlexNet讲解及Pytorch实践
AlexNet由Hinton和他的学生Alex Krizhevsky设计,模型名字来源于论文第一作者的姓名Alex。该模型以很大的优势获得了2012年ISLVRC竞赛的冠军网络,分类准确率由传统的 70%+提升到 80%+,自那年之后,深度学习开始迅速发展。原创 2023-06-18 21:55:50 · 352 阅读 · 1 评论 -
GooLeNet介绍及Pytorch实现
看到GooLeNet的名字是不是感觉似曾相识,没错就是致敬大名顶顶的LeNet,除此之外也称Incepetion-V1。网络架构由Inception与3个辅助分类器构成,每个分类器代表不同深度的分类结果。ResNet出来后,这种思想下的多分类器显得有点多余。话不多说直接看网络模型图与代码。原创 2023-06-18 22:34:38 · 651 阅读 · 0 评论 -
Dinov2(浅薄理解)
论文刚出来不久,也没有深入了解,但可以利用dinov2的预训练模型,搭建自己所需的图像分类、分割网络等。本文原创,如有错误请大家指正。原创 2023-09-25 22:34:15 · 2245 阅读 · 5 评论