YOLO-v8进行配置和训练

最新推荐文章于 2024-08-02 17:15:30 发布

木子Robot

最新推荐文章于 2024-08-02 17:15:30 发布

阅读量1.6k

点赞数

文章标签： YOLO

本文链接：https://blog.csdn.net/weixin_42157689/article/details/132920978

版权

1.配置环境

YOLOV8可以在ubuntu18.04和ubuntu20.04上进行运行。需要使用Cuda、pytorch等深度环境。然后创建虚拟环境：

conda create -n yolov8 python=3.9

创建完虚拟环境后进入：

conda activate yolov8

然后下载安装包：

git clone https://github.com/ultralytics/ultralytics.git

这个就是YOLO-v8的代码包。

2.进行安装

首先安装运行需要的依赖包：

 pip install -r requirements.txt

安装YOLO包时，可以直接pip安装：

pip install ultralytics

这个直接一键安装即可，比较简单，但是后续更改网络结构的时候会比较麻烦，因此不是很推荐。可以通过如下方法进行安装：

pip install -e .

这样可以进行后续的源码更改。

3.进行测试和使用

可以先利用官方的测试案例进行程序的测试：

yolo task=detect mode=predict model=yolov8n.pt source=assets/  device=cpu save=True

运行结果如下：

Ultralytics YOLOv8.0.184 🚀 Python-3.8.0 torch-2.0.1+cu117 CPU (Intel Core(TM) i7-10870H 2.20GHz)
YOLOv8n summary (fused): 168 layers, 3151904 parameters, 0 gradients

image 1/2 /home/lyf/ultralytics/ultralytics/assets/bus.jpg: 640x480 4 persons, 1 bus, 1 stop sign, 36.8ms
image 2/2 /home/lyf/ultralytics/ultralytics/assets/zidane.jpg: 384x640 2 persons, 1 tie, 32.9ms
Speed: 1.5ms preprocess, 34.8ms inference, 0.8ms postprocess per image at shape (1, 3, 384, 640)
Results saved to runs/detect/predict3

当然这个时用CPU进行测试的，也可以将device改为0用GPU进行测试，测试的结果是yolo经典的行人测试和安帅（还有齐玄宗）的测试：
在这里插入图片描述
然后可以进行训练自己的数据集，数据集一般放在/data文件夹下，在这个文件夹下创建四个文件夹：

├── ./data
│   ├── ./data/Annotations
│   ├── ./data/images
│   ├── ./data/ImageSets
│   └── ./data/labels

Annotations保存每个图片对应的xml文件，该文件可以由labelimg工具生成，主要包含图片中的物体信息及对应的位置之类的。images包含了样本的图形文件，ImageSets用来保存数据集划分，例如训练集、验证集和测试集，通常以文本文件的形式列出每个数据集中的图像名称或ID。labels用来保存与images中的每张图像对应的标签数据，但是这些数据可能是为不同格式（如Yolo读取的txt）。

利用如下的程序进行数据集的划分：

# coding:utf-8
 
import os
import random
import argparse
 
parser = argparse.ArgumentParser()
#xml文件的地址，根据自己的数据进行修改 xml一般存放在Annotations下
parser.add_argument('--xml_path', default='data/Annotations2', type=str, help='input xml label path')
#数据集的划分，地址选择自己数据下的ImageSets/Main
parser.add_argument('--txt_path', default='data/ImageSets', type=str, help='output txt label path')
opt = parser.parse_args()
 
trainval_percent = 0.9
train_percent = 0.8
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)
 
num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)
 
file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')
 
for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)
 
file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

利用如下程序将xml文件转化为txt文件：

import xml.etree.ElementTree as ET
import os

sets = ['train', 'test', 'val']
classes = ['bottle', 'mouse', 'block']

def convert(size, box):
    dw, dh = 1. / size[0], 1. / size[1]
    x, y = (box[0] + box[1]) / 2.0, (box[2] + box[3]) / 2.0
    w, h = box[1] - box[0], box[3] - box[2]
    return x * dw, y * dh, w * dw, h * dh

def convert_annotation(image_id):
    xml_path = f'data/Annotations/{image_id}.xml'
    txt_path = f'data/labels/{image_id}.txt'
    
    if not os.path.exists(xml_path):
        print(f"XML file {xml_path} not found.")
        return

    with open(xml_path, 'r', encoding='utf-8') as xml_file, open(txt_path, 'w', encoding='utf-8') as txt_file:
        tree = ET.parse(xml_file)
        root = tree.getroot()
        
        size = root.find('size')
        if size is None:
            return
        
        w, h = int(size.find('width').text), int(size.find('height').text)

        for obj in root.iter('object'):
            difficult = obj.find('difficult')
            if difficult is None or int(difficult.text) == 1:
                continue

            cls_name = obj.find('name').text
            if cls_name not in classes:
                continue

            cls_id = classes.index(cls_name)
            xmlbox = obj.find('bndbox')
            b = (
                float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text),
                float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)
            )
            
            print(image_id, cls_name, b)
            bb = convert((w, h), b)
            txt_file.write(f"{cls_id} {' '.join(map(str, bb))}\n")

def main():
    if not os.path.exists('data/labels/'):
        os.makedirs('data/labels/')

    for image_set in sets:
        image_ids_path = f'data/ImageSets/{image_set}.txt'
        if not os.path.exists(image_ids_path):
            print(f"File {image_ids_path} not found.")
            continue
        
        with open(image_ids_path, 'r') as id_file:
            image_ids = id_file.read().strip().split()

        with open(f'data/{image_set}.txt', 'w') as list_file:
            for image_id in image_ids:
                list_file.write(f'data/images/{image_id}.jpg\n')
                convert_annotation(image_id)

if __name__ == "__main__":
    main()

需要注意修改文件的路径和类别的数量与名称，这个是非常关键的地方！！

然后进行.yaml文件的编写，这个也是一个重要的文件：

train: /home/xxx/ultralytics/ultralytics/data/train.txt
val: /home/xxx/ultralytics/ultralytics/data/val.txt
test: /home/xxx/ultralytics/ultralytics/data/test.txt

# number of classes
nc: 3

# class names
names: ['bottle', 'mouse', 'block']

推荐使用绝对路径，这样不会出现错误。

然后就可以进行训练：

yolo task=detect mode=train model=cfg/models/v8/yolov8.yaml data=data/data.yaml batch=32 epochs=100 imgsz=640 workers=16 device=0

model部分可以进行模型的选择与更改，其余的参数都可以根据自己电脑的性能进行修改。训练完成后就可以进入runs文件夹下面看自己的训练成果啦！

木子Robot

关注

0
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
2
评论
YOLO-v8进行配置和训练

Annotations保存每个图片对应的xml文件，该文件可以由labelimg工具生成，主要包含图片中的物体信息及对应的位置之类的。images包含了样本的图形文件，ImageSets用来保存数据集划分，例如训练集、验证集和测试集，通常以文本文件的形式列出每个数据集中的图像名称或ID。labels用来保存与images中的每张图像对应的标签数据，但是这些数据可能是为不同格式（如Yolo读取的txt）。model部分可以进行模型的选择与更改，其余的参数都可以根据自己电脑的性能进行修改。
复制链接

扫一扫