论文总结
呼啸蓝天
这个作者很懒,什么都没留下…
展开
-
Deformable Convolutional Networks
Deformable Convolutional Networks1.产生背景2.可变形3.直观效果1.产生背景视觉识别中一个挑战是如何适应目标在比例、姿势和部分变形,一种解决方案是扩大数据集到包含所有变化类型的物体,方法有仿射变换。第二种是通过变换不变性特征和算法来提高特征表达的鲁棒性[遇到未见过的情形时算法仍然有较好的输出]。后者通过手工设计的特征不具有“远见”,预判不到对任务有意义的未知几何变换,而且有些已知变换很难通过手工设计不变性特征进行建模。当今几何变换建模的能力主要来源于数据扩增和简单手原创 2020-12-31 18:16:36 · 99 阅读 · 0 评论 -
CBAM: Convolutional Block Attention Module
CBAM: Convolutional Block Attention Module1.前提情要1.1注意力机制1.2池化2.背景3.backbone3.1总体模块图3.2 通道注意力模块3.3空间注意力模块4.收获1.前提情要1.1注意力机制提到注意力这个名词,打个比方,人看事物时并不是注意事物的全体,而是注意感兴趣的地方或者更加有辨别性的地方,类似的是,特征提取网络中也有注意力机制,让网络提取到更重要的特征,而抑制对任务不重要的特征。注意力分为以下两种:通道注意力:回答what,即哪些特征是最原创 2020-12-29 21:32:59 · 659 阅读 · 2 评论 -
CR-FPN: channel relation feature pyramid network for object detection
CR-FPN: channel relation feature pyramid network for object detection背景解决方案过程结论背景FPN等特征融合“插件”只考虑到了为给底层特征图添加强语义信息而没有考虑到融合不同层次的特征图不同的通道之间的关联关系,贸然融合的结果会带来一些噪音导致降低检测效果。如何考虑通道之间的通道关系让特征融合产生的特征对目标识别具有更强的辨别性是该文献的解决方向。解决方案提出CR-FPN(channel relation feature pyra原创 2020-12-28 18:10:16 · 387 阅读 · 0 评论 -
Deep Feature Pyramid Reconfiguration 目标检测中的深度特征金字塔重构
决策树摘要笔记points总结摘要最新的目标检测算法通常通过特征金字塔来学习多尺度的表示以获得更好的预测结果,但是当前特征金字塔的设计在整合不同尺度的语义信息方面仍效率低下。在本文中,我们从研究现有的特征金字塔开始,提出了一种新的重构架构,以高度非线性但有效的方式将低级表示与高级语义特征结合起来。特别地,我们的架构由全局关注和局部重新配置组成,能够在全球和局部的不同空间位置和尺度上聚集面向任务的特征。全球关注和本地重新配置都是轻量级的、到位的和端到端可训练的。在SSD中使用这种方法,与原始模型及其其他原创 2020-11-16 22:27:10 · 418 阅读 · 0 评论 -
基于边缘检测的边界框重构算法提高YOLOv3边界框精度
摘要:利用边缘检测和区域的像素值增强边界框的准确率,根据IOU交并比(分别与真实框进行重叠区域占联合区域的比例),证明可以比YOLOv3的预测框精确。问题:1.为什么精确的边界框定位可以最小化硬件成本。答:在无人驾驶和机器人系统中,除了目标检测软件定位目标的位置外,也需要大量的硬件传感器。因为当一个人的生命掌握在技术手中时,哪怕是一毫米的精度都很重要,比如无人驾驶。所以,若目标检测软件能够捕捉精确的目标位置,可以帮助减少硬件成本和降低普通消费者和行业的总体成本。2.YOLOv3被应用于哪些领域,有原创 2020-11-13 22:00:54 · 2033 阅读 · 8 评论