目录
1 YOLO损失函数与训练
1.1 YOLO损失函数
在上一节中介绍了yolo算法的基本原理,YOLO-V1算法最后输出的检测结果为7x7x30的形式,其中30个值分别包括两个候选框的位置和有无包含物体的置信度以及网格中包含20个物体类别的概率。那么YOLO的损失就包括三部分:位置误差,confidence误差,分类误差。
损失函数的设计目标就是让坐标(x,y,w,h),confidence,classification这个三个方面达到很好的平衡。
而最为简单的做法就是将上述三个部分的损失相加进行训练。值得注意的是,其中的坐标损失中预测出的锚框的高度和宽度采用的先开根号后再计算平方误差,主要是为了同一参数量,不至于在同一类损失中出现较大的参数以免后续神经网络学习起来较差。而在计算置信度损失时,需要采用一个较为经典的评判指标IOU,其计算原理如下。
1.2 YOLO训练
同一般的神经网络的训练过程一致,yolo的训练过程如下:
2 语义分割
2.1 语义分割问题描述
- 语义分割:找到同一画面中的不同类型目标区域。
- 实例分割:同一类目标要区分出来具体实例;
- 目标检测:识别出的目标需要标出外接矩形
图像分割算法发展
2.2 FCN基本结构
通过FCN中的前向卷积和下采样,到之后的反卷积和上采样的跳级连接ie,实现其输出大小与输入图像的大小相同,再经由后续的损失函数计算并进行网络训练,最终得到图像分割结果。
值得说明的是在语义分割中一般计算损失函数的都是两幅图像,而不是一维的数据,所以采用的评价指标也会相应地不同,常见的评价指标如下。