自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(78)
  • 收藏
  • 关注

原创 目标检测论文阅读之Spider:开启图像统一分割新范式

论文:Spider:A Unified Framework for Context-dependent Concept Segmentation。

2024-09-16 18:01:36 747

原创 Conda新建虚拟环境,安装包一直失败:000和404错误

第七步:重新输入conda create -n pytorch python=3.8创建自己的环境,提示成功!第一步:通过命令conda config --show channels查看已有的镜像源地址。最终找到了统一的应对方式:通过vim ~/.condarc 命令编辑condarc文件。第五步:保存并退出Vim:按 Esc键确保处于命令模式,输入:wq,然后按Enter键。第二步:通过vim ~/.condarc 命令编辑condarc文件。第三步:清空condarc,我的是空的,就忽略这一步。

2024-09-11 10:10:50 380

原创 【昇腾AI创新大赛集训营南京站学习笔记】-Ascend算子开发课程

Device负责指定计算运行的真实设备,包含aclrtSetDevice、arlrtResetDevice、aclrtGetDevice、aclrtGetRunMode等众多运行时接口用于进行device管理。执行加队列是因为,Enque本身是堵塞的,有一个Enque完成,vector才能启动。计算并行流动起来,实行流水任务,矢量编程任务间通信和同步,矢量中任务间通信与同步。1)计算类:矩阵计算单元(两个矩阵扔进去相乘)、向量计算单元、标量计算单元。c++,申请之后就要释放,(比如app越用越卡,爆了)

2024-07-23 15:56:59 1095

原创 mmdetection中的Spatial-Transform-Decoupling项目部署,debug记录

安装conda,在root/anaconda/bin。在这之前,因为是新的服务器,很多包没有安装。按ESC 按:wq 删除是Delete。

2024-07-08 20:53:40 374

原创 深度学习之半监督学习:一文梳理目标检测中的半监督学习策略

传统机器学习根据训练数据集中的标注情况,有着不同的场景,主要包括:监督学习、弱监督学习、弱半监督学习、半监督学习。由于目标检测任务的特殊性,在介绍半监督目标检测方法之前,我们查看一下目标检测在四个方向上的具体设定:有监督目标检测:拥有大规模带标签的数据,包括完整的实例级别的标注,即包含坐标和类别信息弱监督目标检测:数据集中的标注仅包含类别信息,不包含坐标信息弱半监督目标检测:数据集中拥有部分实例级别的标注,大量弱标注数据,模型希望利用大规模的弱标注数据提升模型的检测能力半监督目标检测。

2024-07-02 15:51:11 1128

原创 import name ‘UnencryptedCookieSessi_annot ionFactoryConfig‘

下载apex不能简单地运行。

2024-07-01 16:25:41 175

原创 注意力机制之ECA-Net:Efficient Channel Attention for Deep Convolutional Neural Network

近年来,通道注意机制被证明在改善深层卷积神经网络(CNN)的性能方面提供了巨大的潜力。然而现有的大多数方法都致力于开发更复杂的注意模块以获得更好的性能,这不可避免地增加了模型的复杂性。为了克服性能和复杂度的矛盾,提出了一种高效的通道注意力(ECA)模块,该模块只需要很小的参数,同时可以带来明显的性能提升。通过对SENET中通道注意模块的剖析,我们实证地表明避免降维对于学习通道注意是重要的,适当的跨通道交互可以在显著降低模型复杂度的同时保持性能。

2024-06-30 20:03:22 710

原创 目标检测常用涨点方法:注意力机制小结(空间注意力、通道注意力、CBAM等)

它使用了压缩和激励机制,在压缩阶段额外引出一个分支,该分支压缩全局空间信息学习到特征权重,此权重可以视作不同通道所分配的“注意力”,越重要的通道获得的权重越大,集中分配更多的资源训练学习。空间注意力的实施主要有两个步骤,首先在特征不同的通道上进行平均池化或最大池化,对比不同通道之间的像素值,来获得该像素点不同通道上最重要的部分。如上图所示,CBAM的主要目标是通过在CNN中引入绿色框所示的通道注意力和紫色框所示的空间注意力来提高模型的感知能力,从而在不增加网络复杂性的情况下改善性能。

2024-06-30 17:53:33 627

原创 论文阅读之旋转目标检测ARC:《Adaptive Rotated Convolution for Rotated Object Detection》

旋转物体检测旨在识别和定位图像中任意方向的物体。在这种情况下,物体的方向在不同图像中差异很大,而一幅图像中存在多个物体方向。这种固有特性使得标准主干网络很难提取这些任意方向物体的高质量特征。在本文中,我们提出了自适应旋转卷积 (ARC)模块来应对上述挑战。在我们的ARC模块中,卷积核自适应地旋转以提取不同图像中方向不同的物体特征,并引入了一种高效的条件计算机制来适应图像中物体的大方向变化。这两种设计在旋转物体检测问题中无缝协作。

2024-06-30 13:23:10 1278

原创 伪装目标检测论文阅读 VSCode:General Visual Salient and Camouflaged Object Detection with 2D Prompt Learning

显著物体检测和伪装物体检测是相关但又不同的二元映射任务,这些任务涉及多种模态,具有共同点和独特线索,现有研究通常采用复杂的特定于任务的专家模型,可能会导致冗余和次优结果。我们引入了VSCode,这是一种具有新颖的2D提示学习的通用模型,用于联合解决四个SOD任务和三个COD任务,我们利用VST作为基础模型,并在编码器-解码器架构中引入2D提示,以在两个不同的维度上学习领域和任务特定的知识。提示辨别损失有助于解开特殊性。

2024-06-28 17:42:57 1102

原创 【latex学习之参考文献的引用-overleaf平台】

上述例子name就是pang2022zoom,可以自己重命名,比如设置为r1,不重新命名也是可以的。在overleaf首行加入。

2024-06-17 21:13:01 491

原创 深度学习之旋转目标检测复现:ARC-main 关于mvcc,mvcc-full ,mmdet,mmegine的爬坑记录

我是先导入ARC-main整个项目,后下载的BboxToolkit项目,解压后放进ARC-main,在splitn data的过程中,出现BboxToolkit包无法下载的问题,当时我忘记运行命令,cd到BboxToolkit后,即可成功下载BboxToolkit包,直接运行命令无法 成功下载,匹配不到合适的版本包。坑:DOTA数据集,官网上下载的train和test都分为part1,part2,貌似只是压缩包太大了。。解压之后放在一起就可以了,train的原始文件夹是1411张。(心累)在。

2024-06-17 13:48:12 1401

原创 苍穹外卖中的Druid问题

一、jar包启动解决报错 discard long time none recevied connection。升级druid版本到1.2.9。

2024-06-05 22:05:21 137

原创 idea改变任务栏字体样式及大小

*File——>Settings——>Appearancd&Behavior——>Appearanc—>Zoom )**修改Zoom的大小,比例缩放。

2024-06-05 16:50:56 368

原创 python基础知识:py文件转换为jupyter文件

py文件转换为ipynb文件

2024-05-28 10:51:13 561

原创 给pdf加水印,python实现

【代码】给pdf加水印,python实现。

2024-05-28 10:42:46 588

原创 伪装目标检测论文阅读之Dual-SAM(CVPR-2024)

作为水下智能的重要支柱,海洋动物分割(MAS)涉及对海洋环境中的动物进行分割。以往的方法在提取长范围上下文特征方面表现不佳,并且忽略了离散像素之间的连通性。最近,Segment Anything Model(SAM)为一般的分割任务提供了一个通用的框架。遗憾的是,SAM是用自然图像训练的,不能从海洋图像中获得先验知识。此外,地对空导弹的单一位置提示对于事前制导来说是非常不够的。为了解决这些问题,我们提出了一种新的特征学习框架,称为Dual-SAM,用于高性能MAS。

2024-05-08 20:13:47 1281

原创 计算机视觉之边缘提取

1)梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大。图像的边缘是指图像局部区域亮度变化显著的部分,一个灰度值在很小的缓冲区域内急剧变化到另一个灰度相差较大的灰度值。通过边缘算子提取轮廓,例如Sobel算子。

2024-05-05 21:42:18 268 1

原创 tensorboard:远程服务器查看不显示问题

自己租的autodl平台的显卡,在查看tensorboard自己设置的scalar和图片时显示无法访问。将代码中的summarywriter路径更改到root/tf-logs下面,即可查看表格曲线。

2024-04-29 22:22:44 132

原创 伪装目标检测论文阅读 SAM大模型之参数微调:Conv LoRA

任意分割模型(SAM)是图像分割的基本框架。虽然它在典型场景中表现出显著的零镜头泛化,但当应用于医学图像和遥感等专门领域时,其优势就会减弱。针对这一局限性,本文提出了一种简单有效的参数高效微调方法Conv-Lora。通过将超轻量级卷积参数集成到低阶自适应(LORA)中,Conv-LoRa可以在普通VIT编码器中注入与图像相关的感应偏差,进一步强化了SAM的局部先验假设。

2024-04-28 21:11:11 1878

原创 python目标检测结果图像素转换(二值图和灰度图)

昨天在复现模型的时候发现test的结果图都是黑色的,输出像素发现白色是1,需要将白的像素乘以255,然后再输出,自己写的脚本如下(为了加快速度,用gpu转换,但是感觉速度还是一般)自己更改一下输入和输出的文件夹名称就可以,可以实时查看处理的进度。

2024-04-28 18:15:38 282 1

原创 mathtype设置公式编号,公式居中以及编号靠右

新建样式,然后设置格式-制表位,选择对齐方式,居中对齐设置刚才的一半,右对齐设置刚才的值;看到栏的宽度,然后去设置样式。首先点击栏,选择更多栏去看。

2024-04-24 22:15:38 2224

原创 伪装目标检测系列论文阅读之:C2FNet《Context-aware Cross-level Fusion Network for Camouflaged Object Detection》

伪装目标检测是一项具有挑战性的任务,因为目标与周围环境之间的边界对比度很低。此外,伪装物体的外观变化很大,例如物体的大小和形状,这增加了准确的COD的难度。本文提出了一种新的上下文感知跨级融合网络(C2F-Net)来解决具有挑战性的协同设计任务。具体地说,我们提出了一种注意力诱导的跨层融合模块(ACFM)来整合具有信息的注意系数的多层特征。然后,融合后的特征被馈送到所提出的双分支全局上下文模块(DGCM),该模块产生用于利用丰富的全局上下文信息的多尺度特征表示。

2024-04-23 20:18:47 1676

原创 伪装目标检测中数据集的标注格式:COCO和VOC

这样生成的xml文件,没有之前COD10K标注的segmentation信息,还需要进一步考虑,在转换为xml的脚本中加上识别segmentation部分。1.OSFormer中提供的COD10K的json格式,是coco的格式,但由于伪装目标检测任务的特殊性,标注信息中还有一个segmentation段。

2024-04-23 17:41:18 356

原创 Flask实战

点击Flask同时点击键盘ctrl即可查看Flask的默认初始化函数。在static文件夹下面新建文件夹images,并导入照片。输入网址即可显示图片。

2024-04-15 15:30:46 358

原创 伪装目标检测论文阅读之LINet:《Lightweight camouflaged object detection model based on multilevel feature fusion》

伪装对象与背景环境之间的内在相似性阻碍了伪装对象的自动检测/分割,而用于深度学习的新颖网络架构有望克服这一挑战并提高检测精度。然而,现有的这些用于区分伪装物体及其背景的网络架构没有考虑到检测速度的约束,导致计算复杂度较高,无法满足快速检测的要求。因此,基于人类视觉系统,本研究提出了一种采用多级特征融合的单级轻量级伪装目标检测网络,融合了各种特征层和感受野大小的特征。使用正常伪装物体的三个基准数据集,轻量级网络(LINEt)模型表现出优于现有六种主流伪装物体检测方法的准确性。

2024-04-13 11:33:19 415 2

原创 伪装目标检测论文阅读之:《FEDER:Camouflaged Object Detection with Feature Decomposition and Edge Reconstruction》

标题:《Camouflaged Object Detection with Feature Decomposition and Edge Reconstruction》利用特征分解和边缘重建进行伪装目标检测论文:linkcode:link  识别在视觉上融入周围背景的伪装物体是一个棘手的问题,由于伪装物体与背景的内在相似性以及模糊的边界,COD是一项具有挑战性的任务,解决这个问题的现有方法已经开发出各种模仿人类视觉系统的技术,尽管在很多方法上有效,但当伪装物体对视觉系统具有如此大的欺骗性时候,这些方法

2024-04-09 17:28:12 1362

原创 伪装目标检测论文阅读之:《Confidence-Aware Learning for Camouflaged Object Detection》

任意不确定性捕获了观测结果中的噪声。对于伪装目标检测,由于伪装前景和背景的外观相似,很难获得高精度的注释,特别是目标边界周围的注释。我们认为直接使用“嘈杂”的伪装图进行训练可能会导致模型泛化能力较差。在本文中,我们引入了一种明确的任意不确定性估计技术来表示由于噪声标签而导致的预测不确定性。具体来说,我们提出了一种具有置信度的伪装目标检测(COD)框架,使用动态监督来生成准确的伪装图和可靠的“任意不确定性”。

2024-04-09 16:49:45 952

原创 python环境报错解决:AttributeError: partially initialized module ‘cv2‘ has no attribute ‘_registerMatType‘

是因为同时安装了opencv-python和opencv-contrib-python 版本之间不匹配造成的,删除opencv-contrib-python后opencv-python也会出错,就把两个都删除后安装opencv-python及相匹配的版本的opencv-contrib-python,通过下载低于4.3的版本解决错误。

2024-03-28 23:52:10 1500

原创 深度学习论文阅读之【Distilling the Knowledge in a Neural Network】提炼神经网络中的知识

提高几乎所有机器学习算法性能的一个非常简单的方法是在相同的数据上训练许多不同的模型,然后对它们的预测进行平均[3]。不幸的是,使用整个模型集合进行预测非常麻烦,并且计算成本可能太高,无法部署到大量用户,尤其是在单个模型是大型神经网络的情况下。Caruana 和他的合作者 [1] 已经证明,可以将集成中的知识压缩到单个模型中,该模型更容易部署,并且我们使用不同的压缩技术进一步开发了这种方法。

2024-03-28 15:33:35 980

原创 伪装目标检测之注意力CBAM:《Convolutional Block Attention Module》

我们提出了卷积块注意力模块(CBAM),这是一种简单而有效的用于前馈卷积神经网络的注意力模块。给定一个中间特征图,我们的模块依次推断沿着两个独立维度的注意力图,通道和空间,然后将这些注意力图与输入特征图相乘,进行自适应特征细化。由于CBAM是一个轻量级和通用的模块,它可以无缝地集成到任何CNN架构中,几乎没有额外开销,并且可以与基础CNN一起端到端地进行训练。我们通过在ImageNet-1K、MS COCO检测和VOC 2007检测数据集上进行大量实验来验证我们的CBAM。

2024-03-22 21:17:45 1196

原创 伪装目标检测论文BGNet:Boundary-Guided Camouflaged Object Detection

伪装物体检测(COD)是一项有价值但具有挑战性的任务,它可以分割与周围环境完美融合的物体。现有的深度学习方法往往难以准确识别具有完整精细对象结构的伪装对象。为此,在本文中,我们提出了一种用于伪装目标检测的新型边界引导网络(BGNet)。我们的方法探索了有价值的和额外的对象相关的边缘语义,以指导COD的表示学习,这迫使模型生成突出对象结构的特征,从而促进精确边界定位的伪装对象检测。在三个具有挑战性的基准数据集上进行的大量实验表明,在四个广泛使用的评估指标下,我们的BGNet显著优于现有的18种最先进的方法。

2024-03-15 11:08:21 2124 2

原创 c++字符串输入

用cin做字符输入命令时,如果有空格,TAB,回车,就表示结束。最近在准备编程比赛,复习一下之前学过的内容,太久不看确实生疏了。1.普通输入 cin。

2024-03-14 16:24:44 369

原创 解决pycharm报错Cannot find remote credentials for target config com.jetbrains.plugins.remotesdk.target

最后将工程目录下的.idea目录删除,然后重新创建工程。再将之前的解释器全部删除,重新创建即解决了这个问题。使用的是ssh方式,解释器使用的是conda里的自定义的python。后来,尝试了几种方法,都没法解决,比如删了解释器重新添加等。

2024-03-13 23:57:17 3147

原创 Linux服务器进程退出了,但是显存占用问题的解决

刚刚在用租的服务器train的时候,一直显示 out of memory,但是并没有程序在跑,搜索了一下回忆起来之前遇到过这种问题,是自己看不见进程。再次查看显存,会发现已经清空。查看所有的进程与PID。

2024-03-13 23:53:33 674

原创 深度学习基础知识之通道数channels

在cnn种,通道数就是用于提取特征的滤波器的数量(卷积核数量),在卷积过程中,每个滤波器会对输入特征图进行卷积操作,生成一个新的特征图,通道数就是指卷积后生成的特征图的数量,每个通道可以表示不同的特征信息,例如图像的颜色、边缘、纹理等。这里面352x352表示的是像素大小,即高和宽都为352个像素,而3表示的是通道数,指输入的是3通道的RGB图像,每个颜色通道的取值范围为0-255,可以表示256种颜色强度。大多数的深度学习模型,模型上会展示图片的尺寸,如:352x352x3。

2024-03-12 20:15:19 1284 2

原创 深度学习基础知识之Atrous卷积(空洞卷积)

空洞卷积是一种不增加参数量/运算量,同时增加输出单元感受野的一种方法,Atrous卷积,就是带洞的卷积,卷积核是稀疏的,此外,空洞卷积还可以捕捉多尺度上下文信息,通过设置不同的dilation rate,感受野就会不一样,也即获取了多尺度信息,多尺度信息在视觉任务中相当重要。太久不看代码确实生疏了,盯着一堆不同的dilation,不知道有什么作用,论文中说是Atrous卷积,原来就是空洞卷积的意思。简单来说,就是在原本实心的kernal元素之间按照一定的规律加0作为空格。

2024-03-12 18:49:07 888

原创 实例分割之PolyFormer:《PolyFormer:Referring Image Segmentation as Sequential Polygon Generation》

在这项工作中,不是直接预测像素级分割模板,而是将参考图像分割描述为连续的多边形生成,然后将预测的多边形转换为分割模板。这是由一个新的序列到序列:多边形转换器-PolyFormer实现的,该框架将一系列图像面片和文本查询标记作为输入,并自动回归一系列多边形顶点。为了更准确地进行几何定位,我们提出了一个基于回归的解码器,它直接预测精确的浮点坐标,没有任何的坐标化误差。

2024-03-08 14:17:21 1046

原创 c++编程复习之字符数组:电报文字

输入一行电报文字,将字母变成其下一字母(如’aa’变成’bb’……’zz’变成’aa’其它字符不变)对于 100%100% 的数据,保证字符串的长度不超过 100。输出加密处理后的字符。内存限制:128Mb。时间限制:1000s。

2024-03-04 23:43:36 450

原创 Yolo系列论文阅读:YOLOv9《What You Want to Learn Using Programmanble Gradient Information》

如今的深度学习方法关注的是如何设计最合适的目标函数,使模型的预测结果最接近地面真实。同时,必须设计一个合适的架构,以便于获取足够的信息来进行预测。现有的方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换时,会丢失大量信息。本文将深入研究数据在深度网络中传输时的数据丢失问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务计算目标函数提供完整的输入信息,从而获得可靠的梯度信息来更新网络权重。

2024-03-04 23:36:50 1390

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除