yolov8 pose姿态关键点识别&动物姿态识别

导言

介绍了 Tiger数据集,这是一个专为姿势估计任务设计的多功能数据集。该数据集由来自YouTube 视频的 263 张图片组成,其中 210 张用于训练,53 张用于验证。它是测试姿势估计算法和排除故障的绝佳资源。

尽管虎姿态数据集只有 210 张图像,但它的大小却易于管理,而且具有多样性,因此适合评估训练管道、识别潜在错误,并在使用更大的数据集进行姿态估计之前,作为一个有价值的初步步骤。

在这里插入图片描述

数据集 YAML

YAML(另一种标记语言)文件可用于指定数据集的配置细节。它包含文件路径、类定义和其他相关信息等重要数据。具体来说,对于 tiger-pose.yaml 文件,您可以检查 Ultralytics 老虎姿势数据集配置文件.

tiger.yaml

在这里插入图片描述

# parent
# ├── ultralytics
# └── datasets
#     └── tiger

#具体

Keypoints

kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

Classes

names:
  0: tiger

训练

要在图像大小为 640 的 Tiger-Pose 数据集上对YOLOv8n-pose 模型进行 100 次训练,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

Python
CLI

from ultralytics import YOLO
# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

图片和注释示例

下面是老虎姿势数据集中的一些图像示例及其相应的注释:

数据集样本图像
在这里插入图片描述

镶嵌图像:该图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练过程中使用的技术,可将多幅图像合并为单幅图像,以增加每个训练批次中物体和场景的多样性。这有助于提高模型对不同物体尺寸、长宽比和环境的泛化能力。
该示例展示了 Tiger-Pose 数据集中图像的多样性和复杂性,以及在训练过程中使用镶嵌技术的好处。

推理示例

推理示例

Python
CLI

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

代码获取

计算机视觉、图像处理、毕业辅导、作业帮助、代码获取,远程协助,代码定制,私聊会回复!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿利同学

一角两角不嫌少

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值