- 博客(194)
- 收藏
- 关注
原创 Robust Tiny Object Detection in Aerial Images amidst Label Noise
精确检测遥感图像中的小目标非常困难,因为这类目标视觉信息有限且在场景中频繁出现。此外,手动标注这些小目标不仅费时费力,还容易出错,即产生标签噪声。当使用带有噪声标签的训练集训练检测器时,网络往往倾向于过度拟合错误标签,导致性能不佳。为了解决这一问题,作者提出了DeNoising Tiny Object Detector(DN-TOD)。该方法包含两个关键组成部分:Class-aware Label Correction(CLC)和Trend-guided Learning Strategy(TLS)。
2024-06-10 09:30:38
853
原创 Inner-IoU
作者指出IoU损失在理论上有能力精确描述边界框回归状态,但在实践中,它不能自适应地匹配不同的检测器和检测任务,导致泛化能力较弱。为了解决这个问题,作者首先分析了BBR模型,发现区分不同回归样本并通过不同规模的辅助边界框来计算损失可以有效地加速回归过程。对于高IoU的样本,使用较小的辅助边界框来计算损失可以加快收敛,而低IoU的样本则更适合使用较大尺寸的辅助边界框。基于此Inner-IoU应运而生,它通过辅助边界框来计算IoU损失。
2024-06-07 12:04:25
302
原创 服务器进不去conda环境问题
立即重新加载和应用 .bashrc 配置文件中的设置。当你对 .bashrc 文件进行了修改,比如添加或修改了环境变量、别名(alias)、函数等功能后,通常需要执行这个命令来让这些更改在当前终端会话中生效,而无需关闭并重新打开终端。
2024-06-02 14:54:56
237
原创 mmcv-full安装失败更换whl安装
不知道服务器什么鬼,莫名其妙安装mmcv-full一直报错,这下就真的是一时卸载一直爽。然后path是你的路径。不得已只能去下载轮子。
2024-05-06 11:17:31
360
1
原创 Decoupling Representation and Classifier for Long-Tailed Recognition
本文探讨了深度学习在长尾分布数据集上的分类问题,并提出了将表示学习和分类器学习分开的方法。通过实验发现,即使使用最简单的平衡采样方法,也可以获得高质量的表示学习结果,并且只调整分类器即可实现强大的长尾识别能力。
2024-04-29 09:33:15
607
原创 SimCal(ECCV2020)
本文主要研究了长尾分布下的实例分割问题,并提出了一个简单而有效的解决方案——SimCal方法。在现有的实例检测和分割模型中,它们通常只适用于样本数量相当平衡的数据集,如COCO数据集,而在现实场景下,数据集通常是长尾分布的,这会导致性能下降。作者通过系统地调查了Mask R-CNN模型在LVIS数据集上的表现,发现其准确率下降的主要原因是物体提案分类不准确。为了解决这个问题,作者首先考虑了各种技术来提高长尾分类性能,这些技术确实提高了实例分割结果。然后,作者提出了一种简单的校准框架。
2024-04-26 12:03:15
692
原创 BAGS:Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax
本文探讨了在深度学习模型中解决长尾大型词汇物体检测的问题。作者发现现有的检测方法无法处理极度倾斜的数据集中的少数类别的问题,导致分类器不平衡。直接将长尾分类模型应用到检测框架中并不能解决问题,因为检测和分类之间存在本质差异。为了解决这个问题,作者提出了一个新颖的平衡组softmax(BAGS)模块,通过分组训练来平衡检测框架中的分类器。该模块可以对头部和尾部类别进行隐式调节,并确保它们都得到充分训练,而无需额外采样来自尾部类别的实例。
2024-04-26 11:50:23
706
1
原创 RT-DETR:DETRs Beat YOLOs on Real-time Object Detection(CVPR2024)
作者观察到NMS对YOLOs的速度和准确性有负面影响。(NMS进行后处理,不仅降低了推理速度,而且引入了导致速度和精度不稳定的超参数并且不同的场景对召回率和准确率的重视程度不同,需要仔细选择合适的NMS阈值,这阻碍了实时检测器的发展DETRs为消除NMS提供了另一种选择,然而,高昂的计算成本限制了它们的实用性,阻碍了它们充分发挥排除NMS的优势在本文中,作者提出了实时检测转换器(RT-DETR)解决NMS带来的影响,这是所知的第一个实时端到端对象检测器。
2024-04-17 11:29:06
991
原创 YOLO-World——S(cvpr2024)
YOLO系列检测器对预定义和训练对象类别的依赖限制了它们在开放场景中的适用性。(简单来说就是一旦对象类别被定义和标记,经过训练的检测器只能检测到那些特定的类别)为了解决这个限制,作者提出了YOLO-World——通过视觉语言建模和大规模数据集的预训练,增强了YOLO的开放词汇检测能力。具体来说,作者提出了一种新的可重参数化视觉-语言路径聚合网络(RepVL-PAN)和区域-文本对比损失,以促进视觉和语言信息之间的交互。
2024-04-15 20:17:52
867
原创 Practical Network Acceleration with Tiny Sets
本文中,作者指出在用小型训练集加速网络的情况下,是一种根本优越的方法。它具有较高的加速比,在少样本设置下具有较好的延迟精度性能。为了选择放弃哪些块,作者提出了一个新的概念,即可恢复性来衡量恢复受压网络的难度。最后,作者提出了一种名为PRACTICE的算法来加速只使用少量训练图像集的网络。在ImageNet-1k上平均高出7%的Top-1精度,减少22%的延迟。此外还具有很高的泛化能力,在无数据或域外数据设置下也能很好地工作。
2024-03-25 10:24:19
797
原创 RuntimeError: indices should be either on cpu or on the same device as the indexed tensor (cpu)
输出它们的device,看是否在同一设备上。结果两个gpu一个cpu,转换即可。
2024-03-17 16:59:21
385
原创 RuntimeError: CUDA error: CUBLAS_STATUS_NOT_SUPPORTED when calling `cublasSgemm( handle, opa, opb, m
本地跑不报错,环境配置一模一样,服务器上就报错。。。逛社区看人说把cuda降到10.2然而没起作用。
2024-03-17 11:33:06
515
原创 ImportError: DLL load failed while importing _ext: 找不到指定的模块。
本人是由于cuda11.3遇到无法解决问题,被破降到了10.2,然后就遭遇到了上述问题大概率还是和mmcv有关。
2024-03-16 20:16:30
1795
1
原创 CFINet
对于大小有限的实例,先验和目标区域之间的低重叠会导致优化的样本池受限,而判别信息的缺乏又进一步加剧了识别的难度。(低重叠导致正样本不足且判别信息匮乏)。为了缓解上述问题,作者提出了CFINet,一种基于Coarse-to-fine pipeline和特征模仿学习的两阶段小目标检测框架。首先呢,作者引入Coarse-to-fine RPN (CRPN),通过动态锚点选择策略和级联回归来保证小目标有足够的高质量候选框。
2024-03-12 11:03:53
960
原创 ModuleNotFoundError: No module named ‘aitodpycocotools‘
具体不清楚,反正pip下载也下载不了,改为pycocotools后没问题了。
2024-03-10 11:24:18
391
1
原创 KeyError: ‘FasterRCNN: “RPNHead: \‘HieAssigner is not in the bbox_assigner registry\‘“‘
【代码】KeyError: ‘FasterRCNN: “RPNHead: \‘HieAssigner is not in the bbox_assigner registry\‘“‘
2024-03-10 11:08:34
387
原创 PermissionError: [Errno 13] Permission denied: ‘xview/xView_train.geojson‘
或者可以看下该文件是否真没有相应读取权限,可以尝试管理员方式运行,或修改权限。如果你试图打开一个文件,但你的路径是一个文件夹,就会发生这种情况。我这里直接把原本的json文件拿出来就好了。
2024-03-09 11:10:26
348
原创 DCFL: for Oriented Tiny Object Detection
检测任意方向的微小目标给现有的检测器带来了巨大的挑战,特别是在标签分配方面。定向微小目标的极端几何形状和有限特征仍然会导致严重的不匹配和不平衡问题。具体而言,位置先验、正样本特征和实例不匹配,并且由于缺乏适当的特征监督,极端形状目标的学习存在偏差和不平衡,即特征先验不匹配和正样本不平衡是阻碍定向微小目标标签分配的两个障碍。(此前作者提出的RFLA一定程度上解决了问题,但静态分配不能根据样本的形状自适应划分正负样本,不能过滤掉低质量样本。
2024-03-04 11:26:14
1281
原创 RFLA--F
在本文中,作者指出对于微小目标来说,无论是基于锚的盒先验检测器还是无锚的点先验检测器都是次优的。作者主要观察到现在的基于锚或无锚的标签分配范式会产生许多离群的微小真值样本,导致呢检测器对微小目标的关注减少。为此,作者提出了一个基于高斯接受野的标签分配策略用于微小目标检测。
2024-02-28 16:36:06
1016
原创 Small Object Detection via Coarse-to-fine Proposal Generation and Imitation Learning(ICCV2023)
解决了小目标训练样本不足质量低以及判别信息匮乏的问题提出CFINet引入了由粗到精的区域提议网络(CRPN)解决训练样本不足质量低的问题添加了特征模仿FI分支,并设计了一个损失函数对其进行优化,提升模型对小目标的识别能力和表示效果。
2024-01-17 07:00:00
1544
原创 Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection(CVPR2023)
定向微小目标的极端几何形状和有限特征仍然会导致严重的不匹配和不平衡问题。具体而言,位置先验、正样本特征和实例不匹配,并且由于缺乏适当的特征监督,极端形状对象的学习存在偏差和不平衡。即特征先验不匹配和正样本不平衡是阻碍定向微小目标标签分配的两个障碍。作者提出了一个动态先验和由粗到精的分配器DCFL。一方面,以动态方式对先验、标签分配和对象表示进行建模,以减轻不匹配问题。另一方面,利用粗糙的先验匹配和更精细的后验约束来动态地标记标签,为不同的实例提供适当和相对平衡的监督。
2024-01-16 12:00:00
954
原创 Begin--RFLA: Gaussian Receptive Field based Label Assignment for Tiny Object Detection(ECCV2022)
作者发现现有的基于锚点和无锚点的探测器在微小目标标签分配中存在尺度-样本不平衡问题,提出了一种基于高斯接受场的标签分配(RFLA)策略用于微小目标检测。具体来讲呢,就是解决了 1. 基于IoU或中心先验过度依赖于重叠的问题 2. 均匀分布的先验和高斯分布的接受野之间的差距将导致gt与分配给它的特征点的接受野之间的不匹配问题在此基础上呢,作者发现由于IoU和RFD不在同一维度,将新的度量直接应用于现有的基于阈值的标签分配结构是不合理的,因此进一步设计了一个分层标签分配器(HLA),逐步减少
2024-01-16 07:00:00
1046
原创 Maintaining Performance with Less Data(待补)
提出了一种用于图像分类的神经网络训练的新方法,动态地减少输入数据(Data Step、Data Increment、Data Cut)
2024-01-10 12:09:26
1136
原创 DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection(ICLR2023补)
我们提出了DINO(带改进去噪锚盒的DETR),一种最先进的端到端目标检测器。DINO通过使用对比方法进行去噪训练,使用混合查询选择方法进行锚点初始化,使用向前看两次方案进行框预测,在性能和效率上都比以前的类der模型有所提高
2024-01-10 07:00:00
1415
原创 Moving object detection for vehicle tracking in Wide Area Motion Imagery using 4D filtering(ICPR2016
大多数基于广域运动图像(WAMI)的跟踪器使用基于运动的线索来检测和跟踪运动物体。结果表明,在城市高层建筑环境中,由于视差的影响,误报率非常高。本文提出了一种精确的运动目标检测方法,该方法使用精确的地面正校正方法,结合精确的多视图深度图,将视差效应引起的误报数量减少90%。提出了一种基于中值背景减除得到的运动检测蒙版与图像深度图信息提供的高层结构高度蒙版融合的大比比日航拍城市图像混合移动车辆检测方法。使用建筑物掩模使我们能够将F-measure的目标级检测精度从22.2%提高到79.2%,提高了57%。
2024-01-09 18:43:15
880
原创 Exploiting Temporal Context for Tiny Object Detection(WACV2023)
在本文中,作者通过利用静态摄像机记录的视频序列中可用的时间上下文,解决了实时监控应用中微小物体检测的问题。作者**提出了一个基于YOLOv5的时空深度学习模型**,该模型通过一次处理帧序列来利用时间上下文。此外,提出了一种使用帧差作为显式运动信息的双流架构,进一步提高了对大小为4 × 4像素的运动物体的检测
2024-01-09 10:32:10
1053
原创 ScaleKD: Distilling Scale-Aware Knowledge in Small Object Detector(CVPR2023)
先指出虽然通用目标检测取得了显著成功,但小目标检测的性能和效率并不能令人满意。与现有的平衡推理速度和(SOD)性能之间的权衡不同,作者提出了一种新的尺度感知知识蒸馏(ScaleKD),它将复杂的教师模型中的知识转移到紧凑的学生模型中。1)尺度解耦的特征蒸馏模块:将教师的特征表示分解成多尺度嵌入,从而可以在小目标上对学生模型进行显式特征模拟。2)提出了一种跨尺度的辅助方法来改进有噪声和无信息的边界框预测学生模型,因为这些边界框会误导学生模型,影响知识蒸馏的效果。
2024-01-08 16:03:30
1150
原创 Efficient Classification of Very Large Images with Tiny Objects(CVPR2022)
patch_size:即从高分辨率中提取的子块大小为27×27。clipnorm梯度裁剪(阈值设为5.0)避免梯度爆炸问题。若采用对比学习,从第10个epoch开始。scale:0.2(下采样缩放因子)重叠区域大小设置为1减少边缘信息丢失。每个epoch都进行一次验证。动态采样系数不进行正则化。
2024-01-05 18:39:00
445
1
原创 KeyError: ‘model_state_dict‘
首先确认保存模型时的状态字典键名:确保在保存模型权重时,正确地使用了 model.state_dict() 方法,并且以 ‘model_state_dict’ 作为键将其放入字典中保存。单步调试发现保存模型权重时正确保存了该键值对,再次调试时发现莫名奇妙又没错了。加载模型权重文件时获取model_state_dict键失败。
2024-01-05 07:00:00
1166
原创 os.path.join(a,b)末尾出现\问题
os.path.join() 函数在处理路径时会正确处理路径分隔符,并避免出现多余的斜杠。但是,如果 config[‘save_path’] 或者 config[‘model_name’] 的值中包含了意外的字符(如末尾的点“.”),则会导致输出。其根本原因就在于我的config[‘model_name’]为空字符,如果你的值允许修改,则直接改为非空便好。
2024-01-04 12:00:00
971
原创 UserWarning: torch.nn.utils.clip_grad_norm is now deprecated in favor of torch.nn.utils.clip_grad_no
这样做的目的是限制模型参数的梯度范数,以防止梯度过大导致训练不稳定等问题。版本的函数,将在不增加额外内存开销的情况下完成梯度裁剪操作。后缀版本的函数会直接修改张量的梯度值,而不会创建新的副本。函数已被弃用,并推荐使用。在 PyTorch 中,
2024-01-04 07:00:00
1306
yolo系列论文解读11
2023-11-29
Perseus 软件体系结构顶会,fast2023最佳两篇论文之一
2023-11-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人