![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
cv记录
文章平均质量分 86
mhuang..
这个作者很懒,什么都没留下…
展开
-
yolov8-制作数据集,数据集格式转换(yolo格式-voc格式)附完整代码
yolo训练时可使用的数据集格式为yolo格式以及voc格式, voc格式的数据集在训练时需要先转换为yolo格式,然后根据自己的数据集的位置更改yaml配置文件的文件路径即可。基于目前对Yolo系列训练模型的讲解已经很全面,所以本文主要讲解yolo数据集与voc数据集之间的转换。两种数据集形式的最大区别就是yolo是直接采用txt文件保存模型的labels标签,如下图,每一行都代表着该图像中的一个标签GT。而voc格式的标签是保存在Annotations目录下的xml文件当中,除此之外无差别。原创 2023-08-03 18:26:40 · 15149 阅读 · 12 评论 -
最细致讲解yolov8模型推理完整代码--(前处理,后处理)
筛选完之后得到的输出output_box格式为N * [x,y,w,h,conf(最大类别概率),class] , N是筛选后预测框的个数, 通过[x,y,w,h,conf(最大类别概率),class]这些数据我们就可以将预测框输出绘制在原图像上, 但是要注意,我们此时模型的输入是经过letterbox处理的,所以需要先将预测框的坐标转换回原坐标系的坐标,接下来就对刚刚的(8400,85)进行后处理,先进行置信度过滤,再进行NMS非极大值抑制,本文将这两步筛选操作放在了一个函数中,原创 2023-08-03 16:53:47 · 27552 阅读 · 49 评论 -
yolo系列笔记(v4-v5)
FPN是将特征层向下累加,这样对于任意特征层来说,他是看不到其下面特征层的信息的,PAN在FPN的基础上,采取了个向上加的功能,让特征层包含的信息更全面。,所以其范围是(-1.5,1.5)相当于以左上角的点作为起点的话,预测框是可以超出一个cell的距离的, 像下图3个cell都可以对黑点这个真实框做预测,相当于扩充了正样本的数量,让预测框不被cell限制的那么死。这个基本和Yolov4中的一样,但Yolov5将长和宽也进行的改动,之前的容易出现指数爆炸,造成BwBh值过大,导致训练不稳定。原创 2023-07-30 21:52:20 · 334 阅读 · 1 评论 -
yolo系列学习笔记(yolov1~yolov3-spp)
yolov1 与rcnn系列算法最大的不同就是Yolov1是一阶段直接输出结果, 对每一个grid都进行预测,输出7x7x30的向量, 其中7x7是特征图的方格,每一个格子都是个30维的向量,其中2x4是对两个Bbox的位置的预测(这里注意v1是直接预测Bbox相对于整个图像的值0~1),2x1是置信度(Pr*IOU,Pr表示目标是否落在grid里),20x1是类别。这有一个缺点,因为没限制tx的值,在神经网络迭代的过程中会出现一些波动导致tx的值过大,使得预测框超过了原本基于的这个grid。原创 2023-07-26 23:30:45 · 234 阅读 · 0 评论