![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文解读
文章平均质量分 78
pontoon
这个作者很懒,什么都没留下…
展开
-
何凯明新作ViTDET:目标检测领域,颠覆分层backbone理念
何凯明目标检测新作,颠覆分层Backbone理念。原创 2022-04-27 20:32:00 · 2132 阅读 · 0 评论 -
论文解读:GAN与检测网络多任务/SOD-MTGAN: Small Object Detection via Multi-Task Generative Adversarial Network
1.瓶颈问题:小尺度目标,受限于缺乏足够的目标特征信息,使之很难从背景中区分出来,且小尺度目标一般都是低分辨率、模糊不清的,因此检测性能一般CNN-based目标检测算法都需要使用到下采样操作,导致小尺度目标不仅损失了空间位置信息,且本来很少的目标特征几乎被背景上的特征给淹没了2.本文贡献:提出了一种用于小物体检测的新型统一端到端多任务生成对抗网络(MTGAN),可以与任何现有的检测器结合使用在MTGAN中,生成器网络生成超分辨率图像,并引入多任务判别器网络,以同时区分真实的高分辨率原创 2022-03-07 15:52:32 · 3643 阅读 · 0 评论 -
论文解读:跨模态/多光谱/多模态检测 Cross-Modality Fusion Transformer for Multispectral Object Detection
(可见图像和热成像)右侧的热图像可以在光照不足的情况下捕捉到更清晰的行人轮廓。 此外,热图像还捕捉到被柱子遮挡的行人。在光线充足的白天,视觉图像比热图像具有更多的细节,例如边缘、纹理和颜色。有了这些细节,我们可以很容易地找到隐藏在机动三轮车中的司机,而这在热图像中是很难找到的。1.瓶颈问题:现实世界中环境是不断变化的,比如雨天,雾天,晴天,...原创 2022-03-07 15:44:14 · 10817 阅读 · 6 评论 -
论文解读TransFG: A Transformer Architecture for Fine-grained Recognition
论文解读TransFG: A Transformer Architecture for Fine-grained Recognition问题:Transformer还未应用在图像细分类领域中贡献点:1.vision transformer的输入把图像切分成patch,但是是没有overlap的,文章改成切分patch用overlap(这只能算个trick)2.Part Selection Module通俗讲就是最后一层的输入与vision transformer不同,即把最后一层前.原创 2021-04-09 17:07:03 · 2970 阅读 · 9 评论