yolov5 配置环境，训练自己的数据集，实现识别图片，视频，视频流及代码注释

嘻嘻爱笑

已于 2024-02-21 16:22:16 修改

阅读量2.5k

点赞数 19

文章标签： YOLO python conda pycharm

于 2024-02-17 01:01:34 首次发布

本文链接：https://blog.csdn.net/m0_74129144/article/details/136134239

版权

A创建pytorch环境，pycharm配置环境

安装所需要的库：http://t.csdnimg.cn/znzdj

B制作数据集

（1）在pycharm的终端里面安装labelimg

（2）终端输入：labelimg，打开labelimg

（3）打标签

C开始训练

D训练结果

（1）在本机的这个地方建立文件夹test_images然后将待检测的图片导入其中。

（2）修改图片中第三、四行中的部分代码编辑

（3）运行结果可视化！！此处做了一个对比

Yolov5实时目标检测（视频流）

1. 修改detect.py

2. 修改utils文件夹下的dataloaders.py

i.在detect.py文件中找到if save_img语句

ii.在if save_img所在函数开头加入

iii.在if save_img:语句里面加入

iiii.运行detect.py，在输出文件里面得到添加了帧率的视频（！！但是到这里只有在输出视频里面显示了帧率）

iiiii.将此代码放入图片中所示位置后将在开启摄像头的画面中输出帧率

A创建pytorch环境，pycharm配置环境

参考链接：

Windows安装Anaconda，创建pytorch环境，pycharm配置环境_安装pytorch时卡在100%下不下来-CSDN博客

（1）为conda添加清华源：

（2）创建一个新的环境：

创建完成的指令界面：

（3）查看我们刚才创建的环境是否成功：

（4）切换到新的环境：

（5）安装依赖的库：（1.26.4）

i.（6）安装pytorch：GPU

确定自己cuda的版本（前提是你有英伟达的显卡）。命令： nvidia-smi
上pytorch官网找对应版本的torch和cudatoolkit ， PyTorch 翻到最下面可以看到

找到对应命令下载：

使用 conda list 查看安装的依赖：

ii.（6）安装pytorch：CPU

http://t.csdnimg.cn/JGTkv

进入Pytorch官网PyTorch，点击Get Started.（我的电脑是集成显卡，只能选择CPU版本，如下图所示）

复制Run this Command后面这段代码，在之前的命令行窗口中输入（输入之前要激活pytorch环境），记得删掉后面的-c pytorch（前提是Anaconda中添加了清华大学镜像源，否则不能删除），它表示从官网进行下载，可能会出现下载速度慢或者卡顿。

检查pytorch是否安装成功，输入下面三条代码，如图所示，即表示安装成功

安装成功：

pycharm中配置环境成功

安装所需要的库：http://t.csdnimg.cn/znzdj

（1）先下载yolov5项目：将文件解压缩后，剪切到创建的pycharm项目所在文件夹内

（2）在pycharm的终端里面安装所需要的库（先打开文件）

（3）测验detect.py --环境配置成功

B制作数据集

参考教程

使用Labelimg制作VOC数据集或yolo数据集的入门方法_dic-labels labelimgtoyol-CSDN博客

http://t.csdnimg.cn/v0wNq

http://t.csdnimg.cn/GPEAy

（1）在pycharm的终端里面安装labelimg

（2）终端输入：labelimg，打开labelimg

拍摄了207张照片放到一个文件夹中

（3）打标签

问题：由于训练的数据需要分为三个文件夹：训练集、测试集和验证集。（而我们做的时候只有yolo数据集，因此参考此链接将yolo数据集分为我们需要的三种）http://t.csdnimg.cn/cBTrc

import os
import shutil
import random

random.seed(0)  # 确保随机操作的可复现性

def split_data(file_path, xml_path, new_file_path, train_rate, val_rate, test_rate):
    # 存储图片和标注文件的列表
    each_class_image = []
    each_class_label = []
    
    # 将图片文件名添加到列表
    for image in os.listdir(file_path):
        each_class_image.append(image)
    
    # 将标注文件名添加到列表
    for label in os.listdir(xml_path):
        each_class_label.append(label)
    
    # 将图片和标注文件打包成元组列表并随机打乱
    data = list(zip(each_class_image, each_class_label))
    total = len(each_class_image)
    random.shuffle(data)
    
    # 解压元组列表，回到图片和标注文件列表
    each_class_image, each_class_label = zip(*data)
    
    # 按照指定的比例分配数据到训练集、验证集和测试集
    train_images = each_class_image[0:int(train_rate * total)]
    val_images = each_class_image[int(train_rate * total):int((train_rate + val_rate) * total)]
    test_images = each_class_image[int((train_rate + val_rate) * total):]
    
    train_labels = each_class_label[0:int(train_rate * total)]
    val_labels = each_class_label[int(train_rate * total):int((train_rate + val_rate) * total)]
    test_labels = each_class_label[int((train_rate + val_rate) * total):]

# 定义复制文件到新路径的操作
    def copy_files(files, old_path, new_path1):
        # 遍历列表中的每一个文件名
        for file in files:
            # 打印当前处理的文件名，这只是为了在处理过程中输出信息，便于跟踪进度
            print(file)
            # 使用os.path.join连接旧路径和新文件名，形成完整的旧文件路径
            old_file_path = os.path.join(old_path, file)
            # 检查新的路径是否存在，如果不存在则创建新的路径，这可以确保复制操作不会因为路径不存在而出错
            if not os.path.exists(new_path1):
                os.makedirs(new_path1)
            # 使用os.path.join连接新路径和新文件名，形成完整的新文件路径
            new_file_path = os.path.join(new_path1, file)
            # 使用shutil模块的copy函数复制旧文件到新路径，生成与旧文件相同的新的文件
            shutil.copy(old_file_path, new_file_path)

    # 复制训练、验证和测试的图片和标注文件到指定目录
    copy_files(train_images, file_path, os.path.join(new_file_path, 'train', 'images'))
    copy_files(train_labels, xml_path, os.path.join(new_file_path, 'train', 'labels'))
    copy_files(val_images, file_path, os.path.join(new_file_path, 'val', 'images'))
    copy_files(val_labels, xml_path, os.path.join(new_file_path, 'val', 'labels'))
    copy_files(test_images, file_path, os.path.join(new_file_path, 'test', 'images'))
    copy_files(test_labels, xml_path, os.path.join(new_file_path, 'test', 'labels'))

# 判断当前脚本是否为主程序入口，即直接运行该脚本
if __name__ == '__main__':
    # 定义文件路径变量，指向数据集的原图像文件所在路径
    file_path = "E:\myyolo\yolo\data"
    # 定义xml路径变量，指向数据集的标注后文件所在路径
    xml_path = "E:\myyolo\yolo\mydata"
    # 定义新文件路径变量，指向输出结果文件的新路径
    new_file_path = "E:\myyolo\yolo\final_data"
    # 调用split_data函数，分割数据集，并将结果分别存储到指定的路径中
    split_data(file_path, xml_path, new_file_path, train_rate=0.7, val_rate=0.1, test_rate=0.2)

运行结束后：

数据集已准备完毕。

C开始训练

参考链接:http://t.csdnimg.cn/znzdj（从4.修改yolov5命令行参数开始）

【踩坑】YOLO5 训练模型的测试结果全部相反（标签混乱）：http://t.csdnimg.cn/2OJIO

解决：

使用 labelImg 为图片打好标签后，在为模型配置数据集的 yaml 文件中，class name 列表中的元素顺序应该与标签文件夹中 classes.txt 文件中的标签顺序一致。

报错1：

解决：

在import os后加上

os.environ["GIT_PYTHON_REFRESH"] = "quiet"

报错2：http://t.csdnimg.cn/J7KbI

解决：点击报错里面的链接下载arial.ttf剪切到这个目录里面再重新运行一下train.py

训练成功：

D训练结果

参考链接：http://t.csdnimg.cn/znzdj