追忆苔上雪-CSDN博客

原创 Precision_Agriculture梳理

Precision_Agriculture是一个用于计算遥感光谱参数的开源平台，这里梳理了一点功能，由于采用的图像仅为示例图像，大家可以根据自己的需求自行调整，错误之处敬请包含谅解。

2024-05-21 17:15:07 800

原创论文阅读NAM:Normalization-based Attention Module

卷积块注意力模块（CBAM） (Woo et al. [2018]) 提供了一种按顺序嵌入通道和空间注意力子模块的解决方案，为了避免忽视跨维度交互，三重注意力模块（TAM）) (Misra et al. [2021]) 通过旋转特征图来考虑维度相关性。因此，我们的目标是通过利用训练的模型权重的方差测量来突出显著特征。在这项工作中，我们提出了一种新的基于归一化的注意力模块（NAM），它抑制了不太显著的权重。与Resnet和Mobilenet上的其他三种注意力机制的比较表明，我们的方法具有更高的准确性。

2024-02-26 10:59:08 1460

原创深度学习框架输出可视化中间层特征与类激活热力图

有时候为了分析深度学习框架的中间层特征，我们需要输出中间层特征进行分析，这里提供一个方法。

2023-12-28 14:25:14 965

原创 Crowd Counting近期研究(附代码资源)

近期一些比较新的人群计数算法汇总，文中有代码资源

2023-12-25 21:34:01 1117

原创深度学习之自监督模型汇总（附代码资源）

我们引入了一种名为 BERT 的新语言表征模型，BERT 是双向编码器表征（Bidirectional Encoder Representations from Transformers）的缩写。与最近的语言表征模型（Peters 等人，2018a；Radford 等人，2018）不同，BERT 的设计是通过在所有层中对左右上下文进行联合调节，从未标明的文本中预训练深度双向表征。

2023-12-21 09:29:18 1191

原创 R2O语义分割: Refine and Represent: Region-to-Object Representation Learning

区域到对象表示学习（Region-to-Object Representation Learning，R2O），它在预测分割掩码和使用这些掩码预训练编码网络之间振荡。R2O通过对编码特征进行聚类来确定分割掩码。R2O然后通过执行区域到区域的相似性学习来预训练编码网络，其中编码网络获取图像的不同视图，并将分割的区域映射到相似的编码特征。

2023-12-13 17:58:42 999

原创 CV中的Attention机制：SENet

卷积神经网络（CNNs）的核心构建块是卷积算子，它使网络能够通过融合每层局部感受野内的空间和通道信息来构建信息特征。广泛的先前研究已经调查了这种关系的空间分量，试图通过提高整个特征层次的空间编码质量来增强CNN的代表能力。在这项工作中，我们转而关注通道关系，并提出了一种新的架构单元，我们称之为“Squeeze-and-Excitation”（SE）块，通过显式建模通道之间的相互依赖性，自适应地重新校准通道特征响应。

2023-12-13 16:05:51 413

原创 GPT4All 本地部署教程

省流：偷懒的可以直接看第二章的。

2023-12-13 15:26:51 6952 6

原创拼接不同文件夹中同名图片的方法

有时候为了方便对比不同文件夹中同名图片，需要拼接在一起，这里提供一个拼接方法，当然不同命文件也可以实现拼接，稍微改改就能实现

2023-12-13 15:15:36 586

原创 events.out.tfevents文件信息提取

深度学习训练数据有时候是记录在log文件中，文件名类型为events.out.tfevents.xxx.king,当然这些文件可以通过tensorbord工具可视化，这里提供一些events.out.tfevents文件信息提取的方法。

2023-12-13 14:57:11 1455

原创空间金字塔池化（SPP，Spatial Pyramid Pooling)系列

空间金字塔池化的作用是解决输入图片大小不一造成的缺陷，同时在目标识别中增加了精度。空间金字塔池化可以使得任意大小的特征图都能够转换成固定大小的特征向量，下面针对一些典型的空间金字塔进行盘点。

2023-12-05 16:25:45 2708

原创残差网络ResNet

当更深层次的网络能够开始收敛时，就会暴露出一个退化问题：随着网络深度的增加，精度会饱和（这可能并不奇怪），然后迅速退化。残差网络结构的提出，就是解决了随着网络层数的加深，出现的梯度弥散、梯度爆炸、以及网络退化的现象。

2023-12-01 16:18:17 393

原创深度学习早停机制（Early Stopping）与早退机制（Early exiting）

早停机制，一种机器学习模型调优策略，提升调优效率下图损失值明显经过了欠拟合到过拟合使用早停机制后，模型不再过拟合模型早停是面向模型训练过程的。而在模型内部，也会出现类似的现象，这一现象被叫做过度思考(Overthinking)现象，好比爱迪生让助理计算灯泡的容积。一个博士生助理将问题过度复杂化，计算半天计算不出来。而一个头脑清晰的普通助理反而可以直接用灯泡能容纳的水量，很快就计算出容积。

2023-11-28 18:01:19 3732

原创卷积神经网络经典backbone

特征提取是数据分析和机器学习中的基本概念，是将原始数据转换为更适合分析或建模的格式过程中的关键步骤。特征，也称为变量或属性，是我们用来进行预测、对对象进行分类或从数据中获取见解的数据点的特定特征或属性。

2023-11-26 22:07:02 831

原创 Failed to initialize NVML: Driver/library version mismatch

这就说明不是显存爆了，网上查阅可能的原因是nvidia自动更新了，然后自动更新不完全，导致libnvidia和nvidia版本不一致。但是我不想去重装nvidia，于是尝试重启服务器解决，于是利用nvidia-smi指令查看GPU使用情况，发现报错如下。做一个项目的时候，发现vscode一开始训练就报如下错误。正常来说这是爆显存了，但是服务器并没有其他训练任务。重启后再用nvidia-smi查看，问题解决。利用指令下面指令重启。

2023-11-26 10:11:50 449

原创 RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0

gt来自label，但是这里数据没有输入模型处理，发现下面遍历数据的代码image输进了device，但是gt没有。这行代码中涉及待两个变量，一个是predict，一个是gt。沿着gt寻根溯源，一路翻到Dateset处理代码，定位到报错位置，发现是如下代码。利用下述代码查看两个变量所属的。发现gt这个变量是在cpu上的。

2023-11-25 16:04:25 415

原创自监督LIGHTLY SSL教程

Lightly SSL 是一个用于自监督学习的计算机视觉框架。以下内容主要来自Documentation，部分内容省略，部分专业名字不翻译，主要复现。

2023-11-24 11:03:35 2338

原创深度学习之自监督模型汇总

现有的基于深度学习的遥感图像语义分割方法需要大规模的标注数据集。然而，分割数据集的标注往往过于耗时和昂贵。为了减轻数据标注的负担，最近出现了自监督表示学习方法。然而，语义分割方法需要同时学习高层和低层特征，但现有的大多数自监督表示学习方法通常只关注一个层次，这影响了遥感图像的语义分割性能。为了解决这个问题，我们提出了一种自监督多任务表征学习方法，以捕捉遥感图像的有效视觉表征。我们设计了三个不同的前置任务和一个三重连体网络来同时学习高层和低层图像特征。

2023-11-21 15:02:27 692

原创 U3-YOLOXs: An improved YOLOXs for Uncommon Unregular Unbalance detection of the rape subhealth regio

Title: U3-YOLOXs: An improved YOLOXs for Uncommon Unregular Unbalance detection of the rape subhealth regionsAbstract: Agricultural production in high latitudes could be limited by cold climate. Plant factory allows continuous production all year round, wh

2023-11-21 10:11:04 95

原创深度学习领域中的耦合与解耦

在阅读论文的时候应该会看到两个操作，一个是耦合，一个是解耦，经常搭配着出现的就是两个词语，耦合头（Coupled head）以及Decoupled head（解耦合头），那为什么要耦合，又为什么要解耦。

2023-11-20 15:54:21 1283

原创 Ubuntu 搜狗输入法无法输入中文解决方案（不需要重装，不需要重启服务器）

3.其实到第二步，如果搜狗输入法自动重启了，就不需要这一步，如果没有重启，就在终端输入。Ubuntu 搜狗输入法突然无法输入中文，上午还好用，下午就不好用了，直接上解决方案。找到搜狗的进程，如下图红框中的就是进程。2.直接杀掉这个进程。

2023-11-15 15:35:35 5256 5

原创 colormap与colorbar应用

在做一个项目的时候，需要gridspec.GridSpec生成多子图，其中还涉及到热力图，colorbar单独生成，这里做一个分享，鉴于项目隐私，隐去了一些信息，自己在写的时候可以根据注释调整代码。常用的COLORMAP_JET效果如下，该模式常用于生成热力图。最终子图显示如下，部分关键信息隐去，请谅解。colorbar所有色带如下。

2023-11-15 11:30:59 655

原创灰度图处理方法

做深度学习项目图像处理的时候常常涉及到灰度图处理，这里对自己处理灰度图的方式做一个记录，后续有更新的话会在此更新。

2023-11-15 11:17:40 528

原创深度学习读取txt训练数据绘制参数曲线图的方法

有一些深度学习模型是并不像yolo系列那样最终输出相应的参数图，有很多训练形成了一个训练log文件，于是需要读取log文件中的内容并绘制成曲线图。如下实例，有一个log文件的部分截图，需要将其读取出来并绘制曲线图。废话不多说，直接上代码。

2023-11-08 11:55:20 398

原创 Variations-of-SFANet-for-Crowd-Counting代码复现

这里对训练和测试代码进行相关复现。

2023-10-31 14:04:44 203

原创 Variations-of-SFANet-for-Crowd-Counting可视化代码

本次对其中两个可视化代码进行梳理。

2023-10-30 10:13:07 233

原创卷积神经网络的感受野

需翻墙。

2023-10-24 15:39:18 509 2

原创论文阅读--Crop yield prediction using machine learning: A systematic literature review

摘要： Machine learning is an important decision support tool for crop yield prediction, including supporting decisions on what crops to grow and what to do during the growing season of the crops. Several machine learning algorithms have been applied to suppo

2023-10-24 14:53:58 150

原创论文阅读--基于编码器-解码器的卷积神经网络与多尺度感知模块用于人群计数

Title: Encoder-Decoder Based Convolutional Neural Networks with Multi-Scale-Aware Modules for Crowd CountingAbstract: In this paper, we propose two modified neural networks based on dual path multi-scale fusion networks (SFANet) and SegNet for accurate and

2023-10-14 21:31:57 1001 1

原创 Variations-of-SFANet-for-Crowd-Counting记录

论文：Encoder-Decoder Based Convolutional Neural Networks with Multi-Scale-Aware Modules for Crowd Counting论文链接：https://arxiv.org/abs/2003.05586源码链接：GitHub - Pongpisit-Thanasutives/Variations-of-SFANet-for-Crowd-Counting: The official implementation of "Encod

2023-10-13 15:16:35 384

原创基于点标签的目标检测与计数深度学习框架盘点

9]中的研究表明，在MCNN[5]的每个列结构中学习的特征几乎相同，并且当网络深入时，训练这种架构是无效的。起dkNN(pi)像素的距离，其中dkNN(pi)表示 pi 的 k 个近邻点的平均距离，δ的典型值为0.5，如蓝色圆圈所示，这意味着该区域内大多数像素的最近GT点应该是pi。卷积滤波器的可视化。图中红色表示预测结果，绿色表示人工注释，顶端表示基于密度图的方法，可以看到无法准确预测个体的准确位置，中间表示使用锚框标注，基于检测的方法，容易导致检测目标缺失，尤其是使用NMS(非极大值抑制)的过程。

2023-10-10 18:15:12 935

原创语义分割，实例分割，全景分割梳理

语义分割（semantic segmentation）实例分割（instance segmentation）全景分割（Panoptic Segmentation）下面基于这篇论文进行这几个概念的梳理论文提出并研究了一个称之为全景分割（Panoptic Segmentation，PS）的任务。全景分割统一了语义分割（为每个像素分配一个类标签）和实例分割（检测和分割每个对象实例）这两个典型的不同任务Figure 1. 给定图像(a)；标签如(b)为语义分割（每个像素的类别标签）；

2023-10-08 11:03:25 581

原创 P2PNet-Soy原理梳理

前文总结了P2PNet源码以及P2PNet-Soy源码实现方法，相关链接如下：现在梳理一下P2PNet-Soy原理。

2023-09-25 15:54:09 745 3

原创论文阅读--You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

Title: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite ImageryAbstract: Detection of small objects in large swaths of imagery is one of the primary problems in satellite imagery analytics. While object detection in ground-based imagery

2023-09-15 20:49:21 140 1

基于p2pcrowdcounting的大豆p2p计数模型

空空如也