使用Yolov4训练自己的数据集

最新推荐文章于 2024-07-23 12:23:46 发布

Rosie香香

最新推荐文章于 2024-07-23 12:23:46 发布

阅读量1k

点赞数 18

文章标签： YOLO

本文链接：https://blog.csdn.net/2301_81139318/article/details/138288659

版权

本文介绍了YOLOV4目标检测算法，详细讲解了数据集的准备，包括数据划分和格式转换，以及如何使用Python脚本voc_annotation.py和train.py进行模型训练和预测。重点强调了数据集的标注和PASCALVOC格式的应用。

摘要由CSDN通过智能技术生成

一、什么是Yolov4？

YOLOV4是一种目标检测算法，是YOLO（You Only Look Once）系列的最新版本。YOLO算法通过将目标检测任务转化为一个回归问题来实现实时目标检测，它将图像划分为网格并在每个网格中预测边界框及其相关的类别概率。YOLOV4相比之前的版本具有更高的检测精度和更快的检测速度，它采用了一系列的改进和优化，包括网络结构的改进、损失函数的优化、数据增强的策略等。YOLOV4在计算机视觉领域得到了广泛的应用，在实时目标检测、视频分析、自动驾驶等领域具有重要的意义。

二、数据准备

数据准备是指在进行机器学习或深度学习任务之前，对数据进行收集、清洗、标注、划分等处理的过程。以下是数据准备的一般步骤：这是我们本次使用的数据集链接：水果分类目标检测VOC数据集_数据集-飞桨AI Studio星河社区

1.划分数据集

我们选用的水果数据集是已经标注好的，所以后续不用再对数据进行标注，可直接划分数据集。

我们将标签和图片分别存放在两个不同的文件夹，Annotations文件夹放标签，ImageSets文件夹放图片

2.处理数据集

训练自己的数据集时xml标签文件放入VOCdevkit文件夹下的VOC2007文件夹下的Annotation文件夹中

jpg图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages文件夹中

这里数据集的图片如果是png格式的，需要转换成jpg格式的图片才能继续接下来的操作。转换图片格式的方法如下（代码来自博客冰万森）：

from PIL import Image
import os

# 设置源文件夹和目标文件夹
source_folder = '这里是需要转换的文件夹路径'
target_folder = '这里是转换输出的文件夹路径'

# 检查目标文件夹是否存在，如果不存在则创建
if not os.path.exists(target_folder):
os.makedirs(target_folder)

# 遍历源文件夹中的所有文件
for file_name in os.listdir(source_folder):
if file_name.endswith('.png'):
# 读取PNG图片
img_path = os.path.join(source_folder, file_name)
img = Image.open(img_path)

# 转换为JPEG
rgb_im = img.convert('RGB')

# 保存JPEG图片
target_file_name = file_name[:-4] + '.jpg'
target_img_path = os.path.join(target_folder, target_file_name)
rgb_im.save(target_img_path, 'JPEG')

# 删除原始PNG图片
os.remove(img_path)

print("转换并删除原始PNG图片完成！")
原文链接：https://blog.csdn.net/jiangzhangbing/article/details/138277542