目标检测
文章平均质量分 51
_天明_
这个作者很懒,什么都没留下…
展开
-
yolov4训练自己的数据集
https://blog.csdn.net/qq_35451572/article/details/105921647https://www.cnblogs.com/monologuesmw/p/13035442.html添加链接描述https://blog.csdn.net/weixin_44868057/article/details/106528369原创 2020-08-09 20:03:17 · 222 阅读 · 0 评论 -
YOLOv3 Loss构建详解
https://blog.csdn.net/wqwqqwqw1231/article/details/90667046添加链接描述https://blog.csdn.net/weixin_43384257/article/details/100986249添加链接描述Loss构建首先理解一下网络的输出。以y1为例,y1的输出为1313255,表示整张图被分为1313个格子,每个格子预测3个框,每个框的预测信息包括:80个类别+1个框的置信度+2个框的位置偏差+2个框的size偏差。输出可以理解为是1原创 2020-07-19 20:37:56 · 1344 阅读 · 0 评论 -
Precision 与 Recall
topN:原创 2020-06-06 20:15:47 · 196 阅读 · 0 评论 -
目标不均衡问题
1.什么是“类别不平衡”呢?详细来说,检测算法在早期会生成一大波的bbox。而一幅常规的图片中,顶多就那么几个object。这意味着,绝大多数的bbox属于background。2.“类别不平衡”又如何会导致检测精度低呢?因为bbox数量爆炸。正是因为bbox中属于background的bbox太多了,所以如果分类器无脑地把所有bbox统一归类为background,accuracy也可以刷得很高。于是乎,分类器的训练就失败了。分类器训练失败,检测精度自然就低了。3.那为什么two-stage系就转载 2020-06-01 10:02:58 · 179 阅读 · 0 评论 -
FCOS算法详解
FCOS是一个one-stage的、全卷积的、以每个像素预测物体的方式的目标检测算法,类似于语义分割。现在顶级的目标检测算法,像RetinaNet, SSD, YOLOv3, and Faster R-CNN这都是依赖于anchor boxes,而FCOS是anchor boxes free的。FCOS使用唯一的后处理(NMS),采用ResNeXt-64x4d-101做backbone,AP达到了44.7%,超越了先前的one-stage算法,并且更简单。首次展示了更简单更灵活的目标检测框架提升了目标检原创 2020-05-30 15:07:50 · 836 阅读 · 0 评论 -
SNIP 算法笔记
1:MST2:限定尺寸的梯度回传该算法主要包含两个改进点:1、为了减少前面所提到的domain-shift,在梯度回传时只将和预训练模型所基于的训练数据尺寸相对应的ROI的梯度进行回传。2、借鉴了multi-scale training的思想,引入图像金字塔来处理数据集中不同尺寸的数据。训练数据的分辨率(resolution)和验证数据的分辨率不一致(甚至是差别很大)的时候对效果的影响训练数据中那些尺寸非常大或非常小的object会影响训练效果,因此这篇文章在引入MST思想的同时限定了不同尺寸的ob转载 2020-05-20 19:18:40 · 495 阅读 · 0 评论 -
yolov3
原创 2020-05-20 19:03:57 · 85 阅读 · 0 评论 -
faster RCNN
从上面的三张图可以看出,Faster R CNN由下面几部分组成:1.数据集,image input2.卷积层CNN等基础网络,提取特征得到feature map3-1.RPN层,再在经过卷积层提取到的feature map上用一个3x3的slide window,去遍历整个feature map,在遍历过程中每个window中心按rate,scale(1:2,1:1,2:1)生成9个anchors,然后再利用全连接对每个anchors做二分类(是前景还是背景)和初步bbox regression,最原创 2020-05-20 19:00:38 · 182 阅读 · 0 评论 -
EfficientDet 算法解读
EfficientDet: Scalable and Efficient Object Detectionhttps://zhuanlan.zhihu.com/p/111115509https://zhuanlan.zhihu.com/p/93241232这篇文章的主要贡献点是 BiFPN,Compound Scaling 两部分...原创 2020-05-06 15:39:16 · 633 阅读 · 0 评论 -
yolov3
YOLO v3主要有几个改进点,还是非常赞的:1、类别预测方面主要是将原来的单标签分类改进为多标签分类,因此网络结构上就将原来用于单标签多分类的softmax层换成用于多标签多分类的逻辑回归层。首先说明一下为什么要做这样的修改,原来分类网络中的softmax层都是假设一张图像或一个object只属于一个类别,但是在一些复杂场景下,一个object可能属于多个类,比如你的类别中有woman和per...转载 2019-12-09 11:58:14 · 137 阅读 · 0 评论 -
Precision (精确率、查准率)和recall(召回率、查全率)
在这里插入代码片AP = {}AR = {}min_area = {}for label in range(generator.num_classes()): false_positives = np.zeros((0,)) true_positives = np.zeros((0,)) scores = np.zeros((0,)) num_annotat...原创 2019-12-02 09:49:40 · 525 阅读 · 0 评论 -
MobileNetV2
标准的卷积过程可以看上图,一个2×2的卷积核在卷积时,对应图像区域中的所有通道均被同时考虑,问题在于,为什么一定要同时考虑图像区域和通道?我们为什么不能把通道和空间区域分开考虑?Xception网络就是基于以上的问题发明而来。我们首先对每一个通道进行各自的卷积操作,有多少个通道就有多少个过滤器。得到新的通道feature maps之后,这时再对这批新的通道feature maps 进行标准的1×...转载 2019-04-28 20:54:40 · 236 阅读 · 0 评论 -
M2Det
《M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid》简介:在本文中,我们提出了多层特征金字塔网络(MLFPN)来构造更有效的特征金字塔来检测不同尺度的目标。1:FFMv1 fuses feature maps of the backbone to generate the base featur...转载 2019-04-25 20:57:12 · 572 阅读 · 0 评论