上篇地址 yolo图像识别教程 - 以原神人物识别为例(2)-CSDN博客
本篇主要内容为图像标注工具使用及导出
(一)图像标注
选择左下角AI按钮 - 在上方选择AI模型,有多个厂商,多个任务(识别、分割等)模型可下载,本次任务为图形识别,我选择的是官方预训练YOLO V8m模型,各个型号之间的区别可查看官方文档(YOLOv8 -Ultralytics YOLOv8 文档):
下载时基本都需要科学上网,如果网络条件不满足的,可以参考官方github文档,手动下载onxx模型导入。另外如果有大批量图片需要标注的,可以先标注一部分用于训练,用训练后的模型进行自动标注。官方文档:
https://github.com/cuidid/X-AnyLabeling/blob/main/docs/custom_model.md
导入成功后,按i键即可自动识别图片,也可左下角按钮一次运行所有图片识别。
(二)标注导出
这里先要介绍YOLO导出的格式。例如存在01.jpg图片,标注文件则为01.txt,即标注文件为txt文件,且与图片文件重名。因此即使为不一样的图片格式,例如png与jpg,图片文件也不可以重名。
具体到单个txt文件格式的含义,例如01.txt中内容为:
我简化为 0 , 0.5, 0.6 , 0.9 , 0.8。分别设置为 a, _x , _y , _w , _h
1. a
0为类别序号,即为第0个类别。因此我们在导出前与训练前,需要提前在配置文件中设置类别的顺序。
2. _x _y
_x,_y为归一化后的中心点坐标。例如左上角坐标为(x1,y1),右下角坐标为(x2,y2),那么显然,(x1+x2)/2w,(y1+y2)/2h 为归一化后的中心点坐标。
3._w,_h
_w,_h为归一化后的标注框占总体w,h的比例。例如左上角坐标为(x1,y1),右下角坐标为(x2,y2),那么框的横轴长为(x2-x1),纵轴长为(y2-y1),分别进行归一化为: (x2-x1)/w,(y2-y1)/h。