![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
yolo
文章平均质量分 77
卖strawberry的小女孩
道阻且长,行则将至。
展开
-
YOLO学习笔记5——YOLOV3详解
YOLOV3 骨干网络darknet-53原创 2022-07-05 17:36:46 · 2047 阅读 · 1 评论 -
YOLO学习笔记4——YOLOV2详解+论文解读
YOLOV2、YOLO9000论文连接:https://arxiv.org/abs/1612.08242YOLOv2主要是改进原有的YOLO算法,YOLO的缺点:对相互靠近的物体,以及很小的群体检测效果不好,这是因为一个网格只预测了2个框,并且都只属于同一类;对不常见的角度的目标泛化性能偏弱;定位不准确,尤其是大小物体的处理上,还有待加强;端对端网络在前期训练时非常困难,很难收敛;预训练的输入224x224,预测的输入448x448,模型需要适应图像分辨率的改变;YOLOv2的改进:原创 2022-03-31 17:11:12 · 4387 阅读 · 0 评论 -
YOLO学习笔记3——训练阶段
训练阶段(反向传播)拟合物体深度学习、监督学习:通过梯度下降、反向传播方法迭代的微调神经元中的权重,使损失函数最小化。当有ground truth的中心点落在某一个grid cell中:对于该grid cell产生的两个bbox,由其中与ground truth(人工标注的真实标注框)IOU最大的那个bbox,来负责拟合物体。当没有ground truth的中心点落在某一个grid cell中:对于该grid cell 产生的两个bbox,只需要让这两个bbox的置信度越接近于0。损失函数原创 2022-01-17 17:29:32 · 2781 阅读 · 5 评论 -
YOLO学习笔记2——YOLOv1预测阶段
YOLOV1 预测阶段(前向传播):24层卷积层提取图像特征 + 2层全连接层回归 ——> 7x7x30的tensor输入:448x448x3(图片先缩放)输出:7x7x30的张量(包含所有预测框的坐标、置信度、类别结果)正方形image——>通过若干卷积层、池化层——>得到一个7x7x1024的feature map——>将该feature map拉平——>喂入4096维的全连接层——>输出4096维的向量——>将向量喂入1470个神经元的全连接层——&原创 2021-12-26 22:21:25 · 1696 阅读 · 6 评论 -
YOLO学习笔记1
YOLOv4:Optimal Speed and Accuracy of Object Detection目标检测的最佳速度和准确性:有大量的功能据说可以提高卷积神经网络(CNN)的准确性。需要在大型数据集上对这些特性的组合进行实际测试,并对结果进行理论验证。某些特性可用于某些特定的问题,或仅用于小规模的数据集;而一些特性,如批处理规范化和剩余连接,则适用于大多数模型、任务和数据集。我们假设这些通用特性包括加权剩余连接(WRC)、跨阶段部分连接(CSP)、跨小批量标准化(CmBN)、自反训练(SAT)和原创 2021-12-18 21:32:05 · 1046 阅读 · 0 评论