dear_queen-CSDN博客

原创 Ubuntu 的cuda更新

1.首先进入root，禁用nouveau。3.查找最适合的显卡驱动。2.卸载原有的显卡驱动。

2024-03-26 17:21:50 1067

刚开始了解知识蒸馏这个领域，做个知识拓展学习：参考知识蒸馏即通过一个精度比较高即知识储备比较多的教师模型（当然可以多个教师），将知识迁移给学生模型，该学生模型的结构会较为轻量且高效。在图像识别中，采用教师模型作分类，通常直接输出1 or 0；如在识别马、驴、汽车的过程中，hard targets是在神经网络预测时，该图是马的情况，直接会输出马，即预测概率为马的值为1，对长相略像马的驴也直接会直接输出0。这种方式就是硬标签，这样的方式于我们而言是不利的。

2022-11-02 11:02:03 1099

原创 transformer系列论文-Sliced Recursive Transformer

我们发现，对于以分层方式学习视觉数据上更好的表示是非常重要的，正如我们将在实验的图10中介绍的那样。此外，即使是最简单的递归操作，也可以提高利用参数的紧凑性，而无需修改变压器块结构，这与其他 [50、61、24、55、57、37、31、59] 不同，它们会添加更多参数或涉及来自输入的其他细粒度信息 [19]。，并提出了用于降低递归运算复杂性的自我注意方法的近似方法。-我们研究了在视觉变压器中利用切片组自我注意来利用递归操作的可行性，这是建立有效变压器的有希望的方向，并且以前尚未得到很好的探索。

2022-10-13 14:55:03 720

转载深度学习SOTA的tricks

深度学习SOTA的tricks分享

2022-10-10 09:32:11 222

原创 SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation（NeurIPS 22）

我们介绍了SegNeXt，这是一种用于语义分割的简单卷积网络体系结构。由于在编码空间信息时自我注意的效率，最近基于Transformer的模型已主导语义分割领域。在本文中，我们证明了卷积注意比Transformer中的自注意机制更有效地编码上下文信息。本文对已有成功分割方案进行了重审视并发现了几个有助于性能提升的关键成分，进而促使我们设计了一种新型的卷积注意力架构方案SegNeXt。

2022-09-30 16:30:19 2904 1

原创 transformer系列应用于CV论文理解

对经典的transformer应用于cv中的骨干理解。包含原始的Transformer、ViT以及Swin transformer.....后续可能会继续更新

2022-09-23 16:23:33 1741 2

原创再读HorNet论文

vision transformer是利用多头自注意力机制动态生成权重来混合空间标记（mix spatial tokens），但是自注意输入量的 quadratic complexity极大的阻碍了vision transformer的应用。为此hornet并不向此前方法一样降低自注意力的复杂度，而是通过卷积核全连接层等简单操作实现空间相互作用。hornet的结构在最左边，其中gnconv的作用是通过门控卷积和递归设计高效实现任意阶空间相互作用。我们展示了执行不同交互顺序的代表性空间建模操作。

2022-08-19 10:55:14 2116 2

原创报错RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasGemmEx( handle, opa,

RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasGemmEx( handle, opa, opb, m, n, k, &falpha, a, CUDA_R_16F, lda, b, CUDA_R_16F, ldb, &fbeta, c, CUDA_R_16F, ldc, CUDA_R_32F, CUBLAS_GEMM_DFALT_TENSOR_OP)`

2022-08-18 15:15:36 4459 5

原创 HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

近年来，视觉transformer在基于点积自注意的空间建模机制驱动下，在各种任务中取得了巨大的成功。在本文中，我们展示了视觉transformer背后的关键成分，即输入自适应、远程和高阶空间交互，也可以通过基于卷积的框架有效地实现。我们提出了递归门控卷积(gnConv)，它执行与门控卷积和递归设计的高阶空间交互。新的运算具有高度的灵活性和可定制性，它兼容各种卷积的变体，并将自注意的二阶相互作用扩展到任意阶，而不增加大量的计算量。gnConv可以作为即插即用模块来改进各种视觉变压器和基于卷积的模型。....

2022-08-12 15:54:04 4150 1

原创 python安装合集

安装python库

2022-08-05 09:47:43 911

原创用cygwin下载安装ncview（windows 下安装ncview）

在cygwin下安装ncview软件

2022-08-02 09:34:29 2307 9

原创安装cygwin软件

安装cygwin软件

2022-08-01 12:33:10 796

原创 PP-LiteSeg:代码

前面讲解了pp-liteseg的论文部分，但是其中有些细节不太明确，比如在UAFM结构中attention模块有spatial和channel两种注意力，但是怎么融合的不知道，细节怎么处理的也不太清楚，为此看下代码部分内容UAFM代码部分融合代码部分附录UAFM部分class UAFM(nn.Layer): """ The base of Unified Attention Fusion Module. Args: x_ch (int): The chan

2022-05-02 16:31:02 1469 2

原创 PP-LiteSeg: A Superior Real-Time Semantic Segmentation Model-2022.4.6

最近看到了这个PP-LiteSeg，虽然没有用过paddle但是一直想尝试下，看到这个网络结构看起来不错的亚子，先浅看下叭。论文地址代码地址哈哈哈，这篇论文出自4.6，我还挺紧跟时事呢pp-liteseg的代码段pp-liteseg摘要1.introduction2.related work2.1 semantic segmentation2.2 real-time semantic segmentation2.3 feature fusion module3.proposed method3.1

2022-05-02 16:19:06 5519

原创论文阅读-GiraffeDet: A Heavy-Neck Paradigm for Object Detection

GiraffeDet: A Heavy-Neck Paradigm for Object Detection一般我们遇见的检测器都是更偏重于骨干网络的设计，采用重骨干轻neck的设计理念，本文是采用了轻backbone，重neck的方式。该结构可进行不同空间尺度以及不同级别潜在语义的密集信息交换，。这种设计范式帮助检测器在网络的早期阶段以相同的优先级处理高级语义信息和低级空间信息，使其在检测任务中更有效，同时，该论文提出以S2D Chain为组合模块，构建light backbone，再以Queen Fu

2022-04-20 14:08:42 5494

原创 cv2.error: OpenCV(4.5.5) :-1: error: (-5:Bad argument) in function ‘resize‘

遇到该问题，我第一反应是该opencv-python的版本不兼容，于是卸载重装，但是并未有效。后面在知乎看到说是代码没有问题是数据集问题，求解呀

2022-04-20 09:19:56 11685 11

原创根据csv文件划分类别文件夹

首先看下我的文件：这里train.csv为我们的训练文件目录，包含image和labels两列内容。train_images存放的是全部的训练图像数据，train存放我们即将生成的分类文件夹，目前为空。代码如下：其中label_path是训练csv文件，o_pth为文件目录，new_pth为想要存放的分类文件夹目录。import osimport timeimport shutilimport pandas as pdlabel_path = 'D:\data_test\plant-p

2022-04-05 22:49:33 2305

原创下载安装pydensecrf

直接下载安装pydensecrf会报错时：下载地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/#pydensecrf直接pip install pydensecrf会报错Installing collected packages: pydensecrfRunning setup.py install for pydensecrf … error这里选择上面的链接下载即可：先看下自己的python版本这里选择一个下载其whl文件就可以了...

2022-03-29 13:43:06 3512 7

原创论文速递-ANALYSIS OF VISUAL REASONING ON ONE-STAGE OBJECT DETECTION

https://mp.weixin.qq.com/s/d123w9cW-bh3hk6klT54Tg论文来源：https://arxiv.org/pdf/2202.13115.pdf指出了one -stage的缺陷：However, they lack of ability to consider possible relations between image regions.他们缺乏考虑图像区域之间可能的关系的能力。目前的One-Stage目标检测器对每个图像区域进行单独处理。当考虑图像大小时，

2022-03-25 16:22:43 3978 1

原创 Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation-2018.8.22

最近在学习图像分割，读到一篇论文《Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation》。摘要空间金字塔池化模块或者编码解码结构被广泛应用于深度神经网络的语义分割任务中。前者网络能通过filters探测输入特征信息或者带有多尺度rates以及多尺度感受野的池化操作来编码多尺度语义信息。本文，我们提出结合两种方法的优点。具体来说，我们提出的模型DeepLabv3++，扩展了DeepLabv3，通过

2022-03-25 13:37:34 3993

原创遇到错误TypeError: meshgrid() got an unexpected keyword argument ‘indexing‘

参考：添加链接描述因为torch1.9以上版本就不存在这个参数了，所以可以直接去掉

2022-03-09 18:47:26 2867

原创 jupyter notebook中使用anaconda的虚拟环境

由于已经配置好了虚拟环境了1.先激活虚拟环境pytorch-gpu是我的虚拟环境名称activate pytorch-gpu2.在该环境中安装jupyter安装包 conda install ipykernel3.添加kernelpython -m ipykernel install --name py3pytorch4.可以查看了并切换kernel在这里选择哈...

2022-02-22 16:58:31 1513

原创遇到问题UserWarning: No NMS is available.

UserWarning: No NMS is available. Please upgrade torchvision to 0.3.0+warnings.warn(‘No NMS is available. Please upgrade torchvision to 0.3.0+’)好好的环境布吉岛咋的就坏了，遇到了这个问题。当然，实在不知道怎么解决就重新安装一个新的虚拟环境就好了，但是这个环境已经安了很多包了，直接丢掉太浪费了。而且我还提示说cuda也不支持了，就很奇怪。首先测试下tor.

2022-01-21 10:50:25 2686 3

原创长尾分布-Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax

Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax摘要介绍Introductionrelated workPreliminary and Analysis3.1. Preliminary参考https://blog.csdn.net/sinat_17456165/article/details/106846747论文地址：http://openaccess.thecvf.co

2022-01-18 14:37:53 4026

原创读论文之transformer系列-CvT：将卷积引入transformer

论文地址：https://arxiv.org/abs/2103.15808代码地址：https://github.com/leoxiaobin/CvThttps://github.com/microsoft/CvT/blob/main/lib/models/cls_cvt.pyTransformer大火，最近的论文几乎都是transformer系列了，但是CNN也有其可取之处，未来CNN和transformer结合想必是大势所趋。这篇文章将CNN引入Transformer中，取得了比较好的成绩。CV

2022-01-07 11:43:58 15120 1

原创论文笔记：Object Detection in 20 Years: A Survey（目标检测20年研究综述）

参考推荐小白学目标检测必读的一篇综述

2021-12-01 14:10:56 2398

原创 mmdetection训练自己的数据集

mmdetection官方讲解准备数据集数据集格式一般是两种，coco和voc数据集，这里建议大家改成coco的，因为voc格式的config文件真的比较少，大部分都是coco的，而且改起来很麻烦voc的xml文件转coco的json我已经放在这里了。mmdetection├── mmdet├── tools├── configs├── data│ ├── coco│ │ ├── annotations│ │ ├── train2017│ │ ├── va

2021-11-20 16:59:23 522

原创论文阅读-MobileViT

论文地址：MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer代码：pytorch代码作者单位：Apple参考： https://mp.weixin.qq.com/s/HggXYrhMLqVqnoIcsCOBGg摘要：轻量级卷积神经网络（CNN）实际上是用于移动视觉任务的。他们的空间归纳偏差使他们能够在不同的视觉任务中以较少的参数学习表征。然而，这些网络在空间上是局部的。为了学习全局表征，采

2021-10-13 16:04:44 2211 1

原创图像处理学习-图像采样和量化

参考https://www.jianshu.com/p/84b40bd8436dhttps://blog.csdn.net/zqhwando/article/details/78871140许多传感器的输出是连续的电压波形，这些波形的幅度和空间特性都与感知的物理现象有关，为了产生一幅数字图像，我们需要把连续的感知数据转换为数字形式，这种转换包括两种处理，即取样和量化。基础概念：取样：对坐标值进行数字化称为取样。重采样：当欲知不位于矩阵点上的原始函数的数值时就需要进行内插，此时称为重采样。上采样

2021-10-05 13:29:39 4737

原创 SSH连接服务器，防止训练中断方法

参考方法1：https://blog.csdn.net/qq_36183881/article/details/115507270参考方法2：参考2

2021-09-30 09:49:22 703

原创简单方法pycharm通过xshell连接带跳转机的服务器

翻看博文，通常搜到的都是链接1的方式链接1下面这个方法通过xshell建立隧道连接后，pycharm再远程连接链接2步骤1：xshell建立隧道连接1.首先建立jump（跳转机的会话）点文件->新建注意：名称可以随便起，主机为跳转机的主机，端口号一般是222.选择用户身份验证，输入用户名和密码，用户名不知道的一般是root3.点隧道->添加，按照下图所示。点确定，连接。2.建立remote连接remote连接，就是目标主机的连接。1.选择文件->新建按下图所

2021-09-29 15:47:13 2914

原创好用的代码合集（数据集处理）

1.coco转voc格式from pycocotools.coco import COCOimport osimport shutilfrom tqdm import tqdmimport skimage.io as ioimport matplotlib.pyplot as pltimport cv2from PIL import Image, ImageDraw# the path you want to save your results for coco to vocsavep

2021-09-16 15:17:51 1173

原创 YOLOX训练自己的数据集

github下载地址：https://github.com/Megvii-BaseDetection/YOLOX1、准备数据集：2.修改配置文件：文件地址YOLOX-main\yolox\exp\yolox_base.py

2021-09-15 09:11:16 3072 5

原创 YOLOF论文解读

Y ou Only Look One-level Feature摘要介绍MiMo编码器分析参考论文地址： https://arxiv.org/abs/2103.09460代码地址：https://github.com/megvii-model/YOLOF摘要本文指出FPN的成功是由于对目标检测优化问题实行分而治之的方法，而不是多尺度融合。因此本文去掉了FPN结构，采用更加简单高效的方案。主要有两个关键结构–Dilated Encoder and Uniform Matching。COCO数据集上

2021-09-01 10:51:21 635

原创 TOOD（2021年8.18）论文解读

TOOD: Task-aligned One-stage Object Detection摘要1.介绍2. Related Work3.Task-aligned One-stage Object Detection3.1. Task-aligned Head3.2. Task Alignment Learning3.2.1 Task-aligned Sample Assignment3.2.2 Task-aligned Loss4. Experiments and Results4.1. Ablation

2021-08-30 15:08:29 3285

原创小白读论文-YOLOX（2021年6.8）

YOLOXYOLOX摘要YOLOXYOLOx-DarkNet53other Backbones论文地址：https://arxiv.org/pdf/2107.08430.pdf代码地址：https://github.com/Megvii-BaseDetection/YOLOXYOLOX摘要亮点：1.采用anchor-free的方式2.解耦头部3.采用SimOTA结果：YOLONano为0.91M、1.08G Flops，超过NanoDet 1.8%AP比YOLOv3高3%AP相较于YO

2021-08-30 12:25:50 4814

原创小白读论文-U-Net（2015年）

论文题目：U-Net: Convolutional Networks for Biomedical Image Segmentation论文地址：U-Net论文内容摘要1.介绍二级目录三级目录摘要人们普遍认为，深度网络的成功训练需要数千个带注释的训练样本。在本文中，我们提出了一种网络和训练策略，**它依赖于数据增强的强大使用，以更有效地使用可用的注释样本。该体系结构由捕获上下文的收缩路径和实现精确定位的对称扩展路径组成。**我们表明，这种网络可以从很少的图像中进行端到端的训练，并且在电子显微镜堆栈中神

2021-08-27 16:07:22 493

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

yolov4-opencv-dnn-master.zip

k近邻算法ppt.pptx

fire_dataset.rar

fire_detection.tar

八数码问题的整理.pptx

VOC20071.zip

SSD-master.zip

yolov5-master.zip

visdom文件中需要的static.zip

算法中的搜索问题.pptx

八皇后问题的整理.pptx

空空如也