yolo图像识别教程 - 以原神人物识别为例(3)

本文介绍了如何使用YOLOV8模型进行图像识别,包括下载预训练模型、AI标注过程以及YOLO导出的txt文件格式,强调了类别序号、归一化坐标和标注框比例的重要性。
摘要由CSDN通过智能技术生成

上篇地址 yolo图像识别教程 - 以原神人物识别为例(2)-CSDN博客

本篇主要内容为图像标注工具使用及导出

(一)图像标注

选择左下角AI按钮 - 在上方选择AI模型,有多个厂商,多个任务(识别、分割等)模型可下载,本次任务为图形识别,我选择的是官方预训练YOLO V8m模型,各个型号之间的区别可查看官方文档(YOLOv8 -Ultralytics YOLOv8 文档):

下载时基本都需要科学上网,如果网络条件不满足的,可以参考官方github文档,手动下载onxx模型导入。另外如果有大批量图片需要标注的,可以先标注一部分用于训练,用训练后的模型进行自动标注。官方文档:

https://github.com/cuidid/X-AnyLabeling/blob/main/docs/custom_model.md

导入成功后,按i键即可自动识别图片,也可左下角按钮一次运行所有图片识别。

(二)标注导出

这里先要介绍YOLO导出的格式。例如存在01.jpg图片,标注文件则为01.txt,即标注文件为txt文件,且与图片文件重名。因此即使为不一样的图片格式,例如png与jpg,图片文件也不可以重名。

具体到单个txt文件格式的含义,例如01.txt中内容为:

我简化为 0 , 0.5,  0.6 , 0.9 , 0.8。分别设置为 a, _x ,  _y ,  _w , _h

1.  a

      0为类别序号,即为第0个类别。因此我们在导出前与训练前,需要提前在配置文件中设置类别的顺序。

2. _x _y

      _x,_y为归一化后的中心点坐标。例如左上角坐标为(x1,y1),右下角坐标为(x2,y2),那么显然,(x1+x2)/2w,(y1+y2)/2h 为归一化后的中心点坐标。

3._w,_h

      _w,_h为归一化后的标注框占总体w,h的比例。例如左上角坐标为(x1,y1),右下角坐标为(x2,y2),那么框的横轴长为(x2-x1),纵轴长为(y2-y1),分别进行归一化为: (x2-x1)/w,(y2-y1)/h。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值