paper reading
文章平均质量分 92
paper reading
长沙有肥鱼
这个作者很懒,什么都没留下…
展开
-
YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information全文翻译
今天的深度学习方法关注的是如何设计最合适的目标函数,使模型的预测结果最接近真实值。同时,必须设计一个适当的体系结构,以方便获取足够的预测信息。现有方法忽略了一个事实,即输入逐层进行特征提取和空间变换时,会丢失大量的信息。本文将深入研究数据在深度网络中传输时的重要数据丢失问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权值。此外,设计了一种新的基于梯度路径规划的原创 2024-02-26 16:03:22 · 1000 阅读 · 0 评论 -
Shape-IoU: More Accurate Metric considering Bounding Box Shape and Scale
作为检测定位分支的重要组成部分,边界框回归损失在目标检测任务中起着重要作用。现有的边界框回归方法通常考虑GT框和预测框之间的几何关系,通过相对位置和框形来计算损失,而忽略边界框的固有属性(如边界框的形状和尺寸)对边界框回归的影响。为了弥补现有研究的不足,本文提出了一种关注边界框自身形状和尺寸的边界框回归方法。首先,分析了边界框的回归特性,并发现边界框自身的形状和尺寸因素将对回归结果产生影响。基于上述结论提出了Shape IoU方法,该方法通过关注边界框自身的形状和尺寸来计算损失,从而使边界框回归更准确。原创 2024-01-06 14:28:53 · 1370 阅读 · 3 评论 -
Inner-IoU: More Effective Intersection over Union Loss with Auxiliary Bounding Box翻译
随着检测器的快速发展,边界框回归(BBR)损失函数不断进行更新和优化。然而,现有的IoU基于BBR仍然集中在通过添加新损失项来加速收敛,忽略了IoU损失项本身的局限性。尽管从理论上讲,IoU损失可以有效地描述边界框回归的状态,但在实际应用中,它无法根据不同的检测器和检测任务进行自适应调整,且不具备较强的泛化能力。基于上述情况,我们首先分析了BBR模型,并得出结论:区分不同的回归样本以及使用不同尺度的辅助边界框计算损失可以有效加速边界框回归过程。对于高IoU样本,使用较小的辅助边界框计算损失可以加速收敛,而较原创 2023-12-01 16:46:54 · 1048 阅读 · 0 评论 -
DAMO-YOLO : A Report on Real-Time Object Detection Design
提出了一种被称为DAMO-YOLO的快速准确的物体检测方法,该方法比最先进的YOLO系列具有更高的性能。DAMO-YOLO是由YOLO扩展而来的,它采用了一些新技术,包括神经结构搜索(NAS)、高效的重参数化泛化FPN (RepGFPN)、具有AlignedOTA标签分配的轻量级头部和蒸馏增强。特别地,我们使用最大熵原理指导的MAE-NAS方法在低延迟和高性能的约束下搜索我们的检测骨干,生成具有空间金字塔池和焦点模块的ResNetlike / CSP-like结构。在颈部和头部的设计上,我们遵循“大颈部,小原创 2023-01-31 11:56:38 · 2246 阅读 · 0 评论 -
Searching for MobileNetV3翻译
轻量化网络MobileNetV3原创 2022-11-01 16:26:38 · 771 阅读 · 0 评论 -
无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv
No More Strided Convolutions or Pooling:A New CNN Building Block for Low-ResolutionImages and Small Objects 无卷积步长或池化:用于低分辨率图像和小物体的新 CNN 模块SPD-Conv提出了一个名为SPD-Conv的新的CNN构建块,它完全消除了步长和池化操作,取而代之的是一个空间到深度卷积和一个无步长卷积。原创 2022-10-06 16:17:58 · 15772 阅读 · 19 评论 -
Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals翻译
基于拉普拉斯金字塔深度残差的单目深度估计Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals英文注解:Semi-supervisedAnomalyDetectionusingAutoEncoders英文注解-其它文档类资源-CSDN下载Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals全文翻译PDF:Semi-s原创 2022-05-30 22:04:20 · 3633 阅读 · 13 评论 -
Semi-supervised Anomaly Detection using AutoEncoders
相关资源:全文翻译PDF:Semi-supervisedAnomalyDetectionusingAutoEncodersPDF-行业报告文档类资源-CSDN下载全文翻译word:Semi-supervisedAnomalyDetectionusingAutoEncoders-行业报告文档类资源-CSDN下载原文注解:Semi-supervisedAnomalyDetectionusingAutoEncoders英文注解-行业报告文档类资源-CSDN下载使用自动编码器的半监督异常检测.原创 2022-04-29 22:42:47 · 946 阅读 · 4 评论 -
YOLOv4: Optimal Speed and Accuracy of Object Detection
YOLOv4:目标检测的最佳速度和精度摘要有大量的特征据说可以提高卷积神经网络(CNN)的准确性。需要在大数据集上对这些特征的组合进行实际测试,并对结果进行理论论证。有些特性仅适用于某些模型和某些问题,或仅适用于小规模的数据集; 而一些特性,如批处理规范化和残差连接,适用于大多数模型、任务和数据集。我们假设这些通用特征包括加权残差连接(Weighted-Residual-Connections, WRC),跨阶段部分连接(CSP),跨小批量标准化(CmBN)、自我对抗训练(SAT)和mishish原创 2022-04-13 15:35:00 · 4914 阅读 · 0 评论 -
YOLOv3: An Incremental Improvement
论文下载地址:https://pjreddie.com/media/files/papers/YOLOv3.pdfhttps://pjreddie.com/media/files/papers/YOLOv3.pdf翻译word和pdf下载地址:YOLOv3:AnIncrementalImprovement论文全文翻译-行业报告文档类资源-CSDN下载YOLOv3:AnIncrementalImprovement论文翻译-行业报告文档类资源-CSDN下载YOLOv3:AnIncrementalI.原创 2022-04-01 16:58:28 · 1189 阅读 · 0 评论