自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(113)
  • 收藏
  • 关注

原创 论文阅读NAM:Normalization-based Attention Module

卷积块注意力模块(CBAM) (Woo et al. [2018]) 提供了一种按顺序嵌入通道和空间注意力子模块的解决方案,为了避免忽视跨维度交互,三重注意力模块(TAM)) (Misra et al. [2021]) 通过旋转特征图来考虑维度相关性。因此,我们的目标是通过利用训练的模型权重的方差测量来突出显著特征。在这项工作中,我们提出了一种新的基于归一化的注意力模块(NAM),它抑制了不太显著的权重。与Resnet和Mobilenet上的其他三种注意力机制的比较表明,我们的方法具有更高的准确性。

2024-02-26 10:59:08 1226

原创 深度学习框架输出可视化中间层特征与类激活热力图

有时候为了分析深度学习框架的中间层特征,我们需要输出中间层特征进行分析,这里提供一个方法。

2023-12-28 14:25:14 641

原创 Crowd Counting近期研究(附代码资源)

近期一些比较新的人群计数算法汇总,文中有代码资源

2023-12-25 21:34:01 888

原创 深度学习之自监督模型汇总(附代码资源)

我们引入了一种名为 BERT 的新语言表征模型,BERT 是双向编码器表征(Bidirectional Encoder Representations from Transformers)的缩写。与最近的语言表征模型(Peters 等人,2018a;Radford 等人,2018)不同,BERT 的设计是通过在所有层中对左右上下文进行联合调节,从未标明的文本中预训练深度双向表征。

2023-12-21 09:29:18 1035

原创 R2O语义分割: Refine and Represent: Region-to-Object Representation Learning

区域到对象表示学习(Region-to-Object Representation Learning,R2O),它在预测分割掩码和使用这些掩码预训练编码网络之间振荡。R2O通过对编码特征进行聚类来确定分割掩码。R2O然后通过执行区域到区域的相似性学习来预训练编码网络,其中编码网络获取图像的不同视图,并将分割的区域映射到相似的编码特征。

2023-12-13 17:58:42 956

原创 CV中的Attention机制:SENet

卷积神经网络(CNNs)的核心构建块是卷积算子,它使网络能够通过融合每层局部感受野内的空间和通道信息来构建信息特征。广泛的先前研究已经调查了这种关系的空间分量,试图通过提高整个特征层次的空间编码质量来增强CNN的代表能力。在这项工作中,我们转而关注通道关系,并提出了一种新的架构单元,我们称之为“Squeeze-and-Excitation”(SE)块,通过显式建模通道之间的相互依赖性,自适应地重新校准通道特征响应。

2023-12-13 16:05:51 388

原创 GPT4All 本地部署教程

省流:偷懒的可以直接看第二章的。

2023-12-13 15:26:51 4840 3

原创 拼接不同文件夹中同名图片的方法

有时候为了方便对比不同文件夹中同名图片,需要拼接在一起,这里提供一个拼接方法,当然不同命文件也可以实现拼接,稍微改改就能实现

2023-12-13 15:15:36 551

原创 events.out.tfevents文件信息提取

深度学习训练数据有时候是记录在log文件中,文件名类型为events.out.tfevents.xxx.king,当然这些文件可以通过tensorbord工具可视化,这里提供一些events.out.tfevents文件信息提取的方法。

2023-12-13 14:57:11 933

原创 空间金字塔池化(SPP,Spatial Pyramid Pooling)系列

空间金字塔池化的作用是解决输入图片大小不一造成的缺陷,同时在目标识别中增加了精度。空间金字塔池化可以使得任意大小的特征图都能够转换成固定大小的特征向量,下面针对一些典型的空间金字塔进行盘点。

2023-12-05 16:25:45 1878

原创 残差网络ResNet

当更深层次的网络能够开始收敛时,就会暴露出一个退化问题:随着网络深度的增加,精度会饱和(这可能并不奇怪),然后迅速退化。残差网络结构的提出,就是解决了随着网络层数的加深,出现的梯度弥散、梯度爆炸、以及网络退化的现象。

2023-12-01 16:18:17 373

原创 深度学习早停机制(Early Stopping)与早退机制(Early exiting)

早停机制,一种机器学习模型调优策略,提升调优效率下图损失值明显经过了欠拟合到过拟合使用早停机制后,模型不再过拟合模型早停是面向模型训练过程的。而在模型内部,也会出现类似的现象,这一现象被叫做过度思考(Overthinking)现象,好比爱迪生让助理计算灯泡的容积。一个博士生助理将问题过度复杂化,计算半天计算不出来。而一个头脑清晰的普通助理反而可以直接用灯泡能容纳的水量,很快就计算出容积。

2023-11-28 18:01:19 2392

原创 卷积神经网络经典backbone

特征提取是数据分析和机器学习中的基本概念,是将原始数据转换为更适合分析或建模的格式过程中的关键步骤。特征,也称为变量或属性,是我们用来进行预测、对对象进行分类或从数据中获取见解的数据点的特定特征或属性。

2023-11-26 22:07:02 743

原创 Failed to initialize NVML: Driver/library version mismatch

这就说明不是显存爆了,网上查阅可能的原因是nvidia自动更新了,然后自动更新不完全,导致libnvidia和nvidia版本不一致。但是我不想去重装nvidia,于是尝试重启服务器解决,于是利用nvidia-smi指令查看GPU使用情况,发现报错如下。做一个项目的时候,发现vscode一开始训练就报如下错误。正常来说这是爆显存了,但是服务器并没有其他训练任务。重启后再用nvidia-smi查看,问题解决。利用指令下面指令重启。

2023-11-26 10:11:50 427

原创 RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0

gt来自label,但是这里数据没有输入模型处理,发现下面遍历数据的代码image输进了device,但是gt没有。这行代码中涉及待两个变量,一个是predict,一个是gt。沿着gt寻根溯源,一路翻到Dateset处理代码,定位到报错位置,发现是如下代码。利用下述代码查看两个变量所属的。发现gt这个变量是在cpu上的。

2023-11-25 16:04:25 378

原创 自监督LIGHTLY SSL教程

Lightly SSL 是一个用于自监督学习的计算机视觉框架。以下内容主要来自Documentation,部分内容省略,部分专业名字不翻译,主要复现。

2023-11-24 11:03:35 2252

原创 深度学习之自监督模型汇总

现有的基于深度学习的遥感图像语义分割方法需要大规模的标注数据集。然而,分割数据集的标注往往过于耗时和昂贵。为了减轻数据标注的负担,最近出现了自监督表示学习方法。然而,语义分割方法需要同时学习高层和低层特征,但现有的大多数自监督表示学习方法通常只关注一个层次,这影响了遥感图像的语义分割性能。为了解决这个问题,我们提出了一种自监督多任务表征学习方法,以捕捉遥感图像的有效视觉表征。我们设计了三个不同的前置任务和一个三重连体网络来同时学习高层和低层图像特征。

2023-11-21 15:02:27 557

原创 U3-YOLOXs: An improved YOLOXs for Uncommon Unregular Unbalance detection of the rape subhealth regio

Title: U3-YOLOXs: An improved YOLOXs for Uncommon Unregular Unbalance detection of the rape subhealth regionsAbstract: Agricultural production in high latitudes could be limited by cold climate. Plant factory allows continuous production all year round, wh

2023-11-21 10:11:04 71

原创 深度学习领域中的耦合与解耦

在阅读论文的时候应该会看到两个操作,一个是耦合,一个是解耦,经常搭配着出现的就是两个词语,耦合头(Coupled head)以及Decoupled head(解耦合头),那为什么要耦合,又为什么要解耦。

2023-11-20 15:54:21 881

原创 Ubuntu 搜狗输入法无法输入中文解决方案(不需要重装,不需要重启服务器)

3.其实到第二步,如果搜狗输入法自动重启了,就不需要这一步,如果没有重启,就在终端输入。Ubuntu 搜狗输入法突然无法输入中文,上午还好用,下午就不好用了,直接上解决方案。找到搜狗的进程,如下图红框中的就是进程。2.直接杀掉这个进程。

2023-11-15 15:35:35 4139 4

原创 colormap与colorbar应用

在做一个项目的时候,需要gridspec.GridSpec生成多子图,其中还涉及到热力图,colorbar单独生成,这里做一个分享,鉴于项目隐私,隐去了一些信息,自己在写的时候可以根据注释调整代码。常用的COLORMAP_JET效果如下,该模式常用于生成热力图。最终子图显示如下,部分关键信息隐去,请谅解。colorbar所有色带如下。

2023-11-15 11:30:59 331

原创 灰度图处理方法

做深度学习项目图像处理的时候常常涉及到灰度图处理,这里对自己处理灰度图的方式做一个记录,后续有更新的话会在此更新。

2023-11-15 11:17:40 496

原创 深度学习读取txt训练数据绘制参数曲线图的方法

有一些深度学习模型是并不像yolo系列那样最终输出相应的参数图,有很多训练形成了一个训练log文件,于是需要读取log文件中的内容并绘制成曲线图。如下实例,有一个log文件的部分截图,需要将其读取出来并绘制曲线图。废话不多说,直接上代码。

2023-11-08 11:55:20 261

原创 Variations-of-SFANet-for-Crowd-Counting代码复现

这里对训练和测试代码进行相关复现。

2023-10-31 14:04:44 177

原创 Variations-of-SFANet-for-Crowd-Counting可视化代码

本次对其中两个可视化代码进行梳理。

2023-10-30 10:13:07 217

原创 卷积神经网络的感受野

需翻墙。

2023-10-24 15:39:18 362 1

原创 论文阅读--Crop yield prediction using machine learning: A systematic literature review

摘要: Machine learning is an important decision support tool for crop yield prediction, including supporting decisions on what crops to grow and what to do during the growing season of the crops. Several machine learning algorithms have been applied to suppo

2023-10-24 14:53:58 101

原创 论文阅读--基于编码器-解码器的卷积神经网络与多尺度感知模块用于人群计数

Title: Encoder-Decoder Based Convolutional Neural Networks with Multi-Scale-Aware Modules for Crowd CountingAbstract: In this paper, we propose two modified neural networks based on dual path multi-scale fusion networks (SFANet) and SegNet for accurate and

2023-10-14 21:31:57 904 1

原创 Variations-of-SFANet-for-Crowd-Counting记录

论文:Encoder-Decoder Based Convolutional Neural Networks with Multi-Scale-Aware Modules for Crowd Counting论文链接:https://arxiv.org/abs/2003.05586源码链接:GitHub - Pongpisit-Thanasutives/Variations-of-SFANet-for-Crowd-Counting: The official implementation of "Encod

2023-10-13 15:16:35 360

原创 基于点标签的目标检测与计数深度学习框架盘点

9]中的研究表明,在MCNN[5]的每个列结构中学习的特征几乎相同,并且当网络深入时,训练这种架构是无效的。起dkNN(pi)像素的距离,其中dkNN(pi)表示 pi 的 k 个近邻点的平均距离,δ的典型值为0.5,如蓝色圆圈所示,这意味着该区域内大多数像素的最近GT点应该是pi。卷积滤波器的可视化。图中红色表示预测结果,绿色表示人工注释,顶端表示基于密度图的方法,可以看到无法准确预测个体的准确位置,中间表示使用锚框标注,基于检测的方法,容易导致检测目标缺失,尤其是使用NMS(非极大值抑制)的过程。

2023-10-10 18:15:12 648

原创 语义分割,实例分割,全景分割梳理

语义分割(semantic segmentation)实例分割(instance segmentation)全景分割(Panoptic Segmentation)下面基于这篇论文进行这几个概念的梳理论文提出并研究了一个称之为全景分割(Panoptic Segmentation,PS)的任务。全景分割统一了语义分割(为每个像素分配一个类标签)和实例分割(检测和分割每个对象实例)这两个典型的不同任务Figure 1. 给定图像(a);标签如(b)为语义分割(每个像素的类别标签);

2023-10-08 11:03:25 481

原创 P2PNet-Soy原理梳理

前文总结了P2PNet源码以及P2PNet-Soy源码实现方法,相关链接如下:现在梳理一下P2PNet-Soy原理。

2023-09-25 15:54:09 624 3

原创 论文阅读--You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

Title: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite ImageryAbstract: Detection of small objects in large swaths of imagery is one of the primary problems in satellite imagery analytics. While object detection in ground-based imagery

2023-09-15 20:49:21 122 1

原创 Pytorch-YOLOv4梳理——原理和复现

首先说一点,就是yolov4的分支有点多,先梳理一下出现的顺序。提出了然后针对YOLOv4的模型缩放(model),提出了针对低端、一般、高端GPU分别设计了3个模型,再说一点,论文给的网站,要拖到下面才能找到pytorch版本的代码。

2023-09-15 12:04:41 432

原创 python小题库(三)

大家好呀,今天继续更新python小题库。

2023-09-09 22:07:31 470

原创 YOLO总结,从YOLOv1到YOLOv3

YOLOv1论文链接:https://arxiv.org/abs/1506.02640检测原理将检测问题转换成回归问题,一个CNN就搞定。即得到一个框的中心坐标(x, y)和宽高w,h,然后作回归任务。B是两个框,5是指参数量,x y w h是确定框的位置,c是置信度的值YOLOv2论文链接:https://arxiv.org/abs/1612.08242检测原理--相对yolov1的改进yolov2中使用了K-means聚类

2023-09-08 15:30:49 174

原创 SPSS多元线性回归数据解读

这个表是为了看模型的拟合度,关注R方和调整后R方,越接近1拟合度越好。但是R方小,也不能完全说明方程拟合的不好,R方与也有关系,所以一般不把R方作为决定性的指标。有的方程Y变化较小,主要是X在变化,直线方程和X轴近乎平行时,这时拟合的方程R2会很小,但是方程显著。所以不能完全用R方来衡量方程拟合的效果。德宾沃森检验若结果在0-4之间,基本可认为数据独立性符合。本例的德宾沃森值为1.37,符合独立性。

2023-09-07 20:12:26 2601

原创 python小题库(二)

大家好呀,今天继续更新python小题库。

2023-09-06 10:49:47 103

原创 python小题库(一)

从今天开始陆续更新一些python的小题库,没有套路,直接上题目和答案。最开始是入门级别的,大神轻喷,小白也可以思考注释中的一些问题,并尝试不同的解决方案。

2023-09-05 14:36:47 159

原创 论文阅读--通用对象检测中的遮挡处理研究综述

Title: Occlusion Handling in Generic Object Detection: A ReviewAbstract: The significant power of deep learning networks has led to enormous development in object detection. Over the last few years, object detector frameworks have achieved tremendous succe

2023-09-04 10:14:24 1052

基于p2pcrowdcounting的大豆p2p计数模型

论文:Improved Field-Based Soybean Seed Counting and Localization with Feature Level Considered中的大豆计数模型,利用pycharm复现,相对开源代码,本次复现做了一些微小的调整,这有助于更加直观的理解代码,温馨提示,自己在复现本代码的时候,要注意参数和路径的设置,要将本模型用于其他作物的时候,请参考模型中的数据自己进行数据制作,并注意代码中的一些细节问题,如png或者jpg格式或者一些别的小细节。

2023-07-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除