![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
目标检测
文章平均质量分 88
Tc.小浩
这个作者很懒,什么都没留下…
展开
-
深度学习-神经网络卷积核理解
文章目录一、前言二、降维/升维增加非线性跨通道信息交互三、 应用实例四、卷积计算为什么卷积核都是奇数呢?一、前言卷积核(convolutional kernel):可以看作对某个局部的加权求和;它是对应局部感知,它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体,而是先从局部开始认识,这就对应了卷积。卷积核的大小一般有1x1,3x3和5x5的尺寸(一般是奇数x奇数)。卷积核的个数就对应输出的通道数(channels),这里需要说明的是对于输入的每个通道,输出每个通道上的卷积核是不一原创 2021-10-24 20:30:15 · 11083 阅读 · 0 评论 -
Focal Loss损失函数、RetinaNet网络
文章目录1、Focal Loss理解总结介绍RetinaNet1、Focal Loss理解总述我们知道object detection的算法主要可以分为两大类:two-stage detector和one-stage detector。前者是指类似Faster RCNN,RFCN这样需要region proposal的检测算法,这类算法可以达到很高的准确率,但是速度较慢。虽然可以通过减少proposal的数量或降低输入图像的分辨率等方式达到提速,但是速度并没有质的提升。后者是指类似YOLO,SSD原创 2021-10-24 19:20:13 · 1121 阅读 · 0 评论 -
注意机制(CBAM)理解
论文题目:《CBAM: Convolutional Block Attention Module》论文地址:https://arxiv.org/pdf/1807.06521.pdf原文链接:https://blog.csdn.net/Roaddd/article/details/114646354参考:https://blog.csdn.net/kangyi411/article/details/78969642文章目录一、前言二、注意力机制(CBAM)2.1 Channel Attention M原创 2021-10-13 15:38:39 · 27275 阅读 · 0 评论 -
神经网络中常见的几种激活函数
文章目录一、常见的几种激活函数1、Sigmoid函数:3、ReLU函数4、ELU函数PReLU函数一、常见的几种激活函数1、Sigmoid函数:曲线:导数:在sigmod函数中我们可以看到,其输出是在(0,1)这个开区间内,这点很有意思,可以联想到概率,但是严格意义上讲,不要当成概率。sigmod函数曾经是比较流行的,它可以想象成一个神经元的放电率,在中间斜率比较大的地方是神经元的敏感区,在两边斜率很平缓的地方是神经元的抑制区。缺陷:1、容易出现梯度消失(gradient vanis原创 2021-10-13 14:57:22 · 3067 阅读 · 0 评论 -
目标检测-Iou(交并比)理解
文章目录一、 IOU概述二、IOU计算三、IOU代码实现一、 IOU概述IOU的全称为交并比(Intersection over Union),是目标检测中使用的一个概念,IoU计算的是“预测的边框”和“真实的边框”的交叠率-,即它们的交集和并集的比值。最理想情况是完全重叠,即比值为1。二、IOU计算IoU等于“预测的边框”和“真实的边框”之间交集和并集的比值。IoU计算如下图,B1为真实边框,B2为预测边框。在对象检测任务中,你希望能够同时定位对象,所以如果实际边界框是这样的,你的算法给出这个原创 2021-10-11 13:58:18 · 39652 阅读 · 3 评论 -
Darknet53网络结构及代码实现
文章目录一、Darknet二、代码实现一、DarknetDarknet是最经典的一个深层网络,结合Resnet的特点在保证对特征进行超强表达的同时又避免了网络过深带来的梯度问题,主要有Darknet19和Darknet53,当然,如果你觉得这还不够深,在你条件允许的情况下你也可以延伸到99,199,999…Darknet53的网络结构如图1所示,其中蓝色方块×1,x2,x8分别表示该模块重复1次、2次和8次,黄色方块是该模块的名字,Conv Block表示该模块是一个普通的卷积模块,Residual原创 2021-10-10 16:48:22 · 12975 阅读 · 7 评论 -
YOLOv3
YOLOv5-P5 640 Figure (click to expand) Figure Notes (click to expand)GPU Speed measures end-to-end time per image averaged over 5000 COCO val2017 images using a V100 GPU with batch size 32, and includes image preprocessing, PyTorch FP1..翻译 2021-07-23 17:44:52 · 870 阅读 · 0 评论 -
Stereo R-CNN解读
Stereo R-CNNStereo R-CNN based 3D Object Detection for Autonomous Driving26 May 2019: Pytorch 1.0.0 and Python 3.6 are supported now. Please checkout to branch 1.0!现在支持Pytorch 1.0.0和Python 3.6。请结帐到This project contains the implementation of our CVPR 20翻译 2021-06-05 17:47:12 · 697 阅读 · 2 评论