yolov8 pose姿态关键点识别&动物姿态识别

阿利同学

于 2024-09-14 11:52:58 发布

阅读量165

点赞数 3

文章标签： YOLO 深度学习计算机视觉关键点检测姿态估计动物姿态识别人工智能

本文链接：https://blog.csdn.net/ALiLiLiYa/article/details/142254740

版权

导言

介绍了 Tiger数据集，这是一个专为姿势估计任务设计的多功能数据集。该数据集由来自YouTube 视频的 263 张图片组成，其中 210 张用于训练，53 张用于验证。它是测试姿势估计算法和排除故障的绝佳资源。

尽管虎姿态数据集只有 210 张图像，但它的大小却易于管理，而且具有多样性，因此适合评估训练管道、识别潜在错误，并在使用更大的数据集进行姿态估计之前，作为一个有价值的初步步骤。

在这里插入图片描述

数据集 YAML

YAML（另一种标记语言）文件可用于指定数据集的配置细节。它包含文件路径、类定义和其他相关信息等重要数据。具体来说，对于 tiger-pose.yaml 文件，您可以检查 Ultralytics 老虎姿势数据集配置文件.

tiger.yaml

在这里插入图片描述

# parent
# ├── ultralytics
# └── datasets
#     └── tiger

#具体

Keypoints

kpt_shape: [12, 2] # number of keypoints, number of dims (2 for x,y or 3 for x,y,visible)
flip_idx: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

Classes

names:
  0: tiger

训练

要在图像大小为 640 的 Tiger-Pose 数据集上对YOLOv8n-pose 模型进行 100 次训练，可以使用以下代码片段。有关可用参数的完整列表，请参阅模型训练页面。

列车示例

Python
CLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-pose.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="tiger-pose.yaml", epochs=100, imgsz=640)

图片和注释示例

下面是老虎姿势数据集中的一些图像示例及其相应的注释：

数据集样本图像
在这里插入图片描述

镶嵌图像：该图像展示了由马赛克数据集图像组成的训练批次。马赛克是一种在训练过程中使用的技术，可将多幅图像合并为单幅图像，以增加每个训练批次中物体和场景的多样性。这有助于提高模型对不同物体尺寸、长宽比和环境的泛化能力。
该示例展示了 Tiger-Pose 数据集中图像的多样性和复杂性，以及在训练过程中使用镶嵌技术的好处。

推理示例

Python
CLI

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a tiger-pose trained model

# Run inference
results = model.predict(source="https://youtu.be/MIBAT6BGE6U", show=True)

代码获取

计算机视觉、图像处理、毕业辅导、作业帮助、代码获取，远程协助，代码定制，私聊会回复!

阿利同学

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫