Detection论文阅读笔记
文章平均质量分 90
Aced96
这个作者很懒,什么都没留下…
展开
-
Focal Loss损失函数
一、交叉熵损失函数原理提示:本文仅为自己学习过程记录,借录了很多大佬的东西,仅供自己以后知识点翻阅使用。1.信息量信息的定义是用来消除随机不确定性的东西。也就是说衡量信息的大小是看信息消除不确定性东西的程度。信息量的大小与信息发生的概率成反比。设某一时间发生的概率为P(x),其信息量表示为:I(x)=−log(P(x))I(x)=-log(P(x))I(x)=−log(P(x))其中I(x)I(x)I(x)表示信息量,这里logloglog表示以e为底的自然对数。2.交叉熵信息熵:也称为熵原创 2020-08-26 18:09:10 · 3452 阅读 · 3 评论 -
空洞卷积的理解
一、空洞卷积的本质空洞卷积(dilated convolution)在标准卷积里注入空洞,增加感受野(reception filed)。空洞卷积比普通卷积多了个超参数称为dilation rate,指的是kernel的间隔数量。普通卷积的dilation rate为1。普通卷积:空洞卷积:二、空洞卷积的优点关于传统深度卷积的up-sampling和pooling layer的缺点2.1 up-sampling(放大特征图)up-sampling(放大特征图):线性插值、反卷积(decon原创 2021-09-06 20:31:03 · 2164 阅读 · 0 评论 -
Repulsion loss的详细理解
本文由同济大学和北京大学合作发表于CVPR2018,聚焦于loss层面,为遮挡情况下的行人检测问题提供了一种行之有效的解决方案。论文:https://arxiv.org/abs/1711.07752一、问题提出1.行人遮挡会造成什么问题当我们在做行人检测时,人与人之间会存在互相遮挡。遮挡会造成2个问题:1.设红色框为目标框T(man)的预测框P,旁边也有个真实框B(woman),我们的P可能会被往B去移动(shift)。2.检测器对NMS的阈值的选取更为敏感。如果NMS阈值选取过小,周围的目标.原创 2020-09-28 16:22:06 · 5249 阅读 · 0 评论 -
Cascade R-CNN 详细解读
原文链接:Cascade R-CNN 详细解读写这篇文章是希望对原文进行解析,帮助大家理解文章的精髓,如有错误的地方还希望指正。从文章的题目上我们就可以看出来这篇文章目标是提高检测质量,希望能获得更精确的检测结果。文章提出的cascade结构的效果是惊艳的,几乎对于任意的R-CNN(Faster rcnn,FPN,R-FCN等)都可以带来2到4个点的AP提升!!!而且实现十分简单,已使用Pytorch在Pascal VOC上复现论文。此外,本篇文章的实验讲解部分对于理解R-CNN网络有很大的帮助,建转载 2020-09-08 16:04:26 · 7781 阅读 · 1 评论 -
Focal Loss for Dense Object Detection论文阅读补充笔记
结合Focal loss损失函数的个人理解这篇文章一起看会比较下饭。论文目标:作者提出focal loss的出发点也是希望one-stage detector可以达到two-stage detector的准确率,同时不影响原有的速度。核心思想:1.one-stage算法精确度跟不上two-stage的原因:样本的类别不均衡导致的。检测过程中图像可能生成成千上万的候选框,但其中只有很少一部分包含目标。有目标的就是正样本,没目标的为负样本,这就带来了极度的类别不平衡。2.类别不平衡会带来什么后.原创 2020-09-14 21:05:26 · 139 阅读 · 0 评论 -
EfficientDet论文阅读补充笔记
一、摘要1.提出了一个基于加权的双向特征金字塔网络(BiFPN)允许简单快速的进行多尺度特征融合。2.提出了一种复合尺度扩张方法,该方法可以统一地对所有的Backbone网络,特征网络和预测网络的分辨率,深度和宽度进行缩放。二、 Introduction能否在有效资源限制范围内,构建高效率高精度的网络?(两个挑战)1.高效的多尺度特征融合2.模型缩放三、 BiFPN1.多尺度特征融合问题a.FPN:自上而下(top-down)结合多尺度特征的方法(P3-P7)Resize通常是上采样原创 2020-08-29 16:36:58 · 422 阅读 · 0 评论