YOLOv1 学习笔记
论文标题: 《You Only Look Once: Unified, Real-Time Object Detection》
论文地址:https://arxiv.org/pdf/1506.02640.pdf
推荐git: https://github.com/leviome/yolo_1_pytorch
作者:Joseph Redmon∗ , Santosh Divvala∗†, Ross Girshick¶ , Ali Farhadi∗†
该论文发表在CVPR2016上(CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECCV))
前言
想要学习YOLO,要有一定的基础,最好能先学习一下卷积神经网络基础篇。
参考:https://www.bilibili.com/video/BV1b7411T7DA/
mAP评价指标
目标检测的重要通用指标mAP,用于衡量算法模型对于数据集中指定目标进行检测的准确程度,这个准确程度有两层含义:第一个指分类的精确程度(pricision);第二个指预测框的准确程度(IOU)。
目标检测的mAP计算,是将模型的输出(被认为是一个包含分类结果,confidence置信度,与目标框坐标的rank list)的所有判断为正例的精确度(AP),进行多目标的平均,即mAP
正则化
参考:https://www.zhihu.com/question/20924039
使用正则化的目的角度:正则化是为了防止过拟合
正则化 英语原文是 regularization-regular-regularize 直译就是 规则化, 在模型中加入一些规则,防止过拟合。
神经网络模型就是使用正则化
正则化 还能 添加先验知识 缩小参数空间 是求解变得可能
损失函数
参考:https://blog.csdn.net/chkay399/article/details/81878157
https://zhuanlan.zhihu.com/p/58883095
损失函数 是用来评价预测值和真实值不一样的程度,损失函数越好(损失函数的值一般是越小越好),通常模型越好。
不同的模型用的损失函数也不一样。
损失函数分为经验风险损失函数 和 结构风险损失函数。经验风险损失函数指预测结果和实际结果的差别,结构风险损失函数是指经验风险损失函数加上正则项。
端到端学习
参考 :https://blog.csdn.net/cs24k1993/article/details/79118460
https://blog.csdn.net/weixin_38145317/article/details/90902425
相对于深度学习,传统机器学习的流程往往由多个独立的模块组成,比如在一个典型的自然语言处理(Natural Language Processing)问题中,包括分词、词性标注、句法分析、语义分析等多个独立步骤,每个步骤是一个独立的任务,其结果的好坏会影响到下一步骤,从而影响整个训练的结果,这是非端到端的。
传统的是分治法,人为的划分子问题,得到的局部最优解不代表全局最优解,而端到端就是直接面向全局。
深度学习模型在训练过程中,从输入端(输入数据)到输出端会得到一个结果,是直接根据期望输出的结果, 这个结果会和真实值相比出现误差,这个误差在模型的每一层传播(反向传播),模型会根据这个误差进行调整,直到模型达到收敛或者预期效果。
端到端学习省去了每一个独立学习任务之前做的数据标注&