快速入门YOLOv8：从安装到实战

最新推荐文章于 2025-05-17 18:10:58 发布

Treasure168

最新推荐文章于 2025-05-17 18:10:58 发布

阅读量786

点赞数 7

文章标签： YOLO windows python

本文链接：https://blog.csdn.net/Treasure168/article/details/148018874

版权

序言

YOLO（You Only Look Once）系列模型以其高效的实时目标检测能力闻名，而YOLOv8作为该系列的最新版本，进一步优化了速度、精度与易用性。本文将带你快速掌握YOLOv8的核心特性、安装方法及实战技巧，助你轻松上手这一前沿技术。

一、YOLOv8的核心优势

更快的推理速度
YOLOv8通过改进骨干网络（Backbone）和颈部网络（Neck）的结构，减少了计算量。例如，采用CSPPC模块替代传统卷积，结合深度可分离卷积，显著降低了FLOPs，同时保持特征提取能力。
更高的检测精度
引入Anchor-Free设计，结合DFL Loss和CIOU Loss优化边界框回归，提升了小目标和遮挡目标的检测效果。支持多任务扩展（检测、分割、分类），适用性更广。
更友好的开发体验
提供简洁的CLI命令行工具和Python API，支持从训练到部署的全流程操作。例如，仅需两行代码即可完成模型加载与推理。

二、环境安装与配置

1. 创建虚拟环境（推荐）

conda create -n yolov8 python=3.9
conda activate yolov8

2. 安装依赖

PyTorch：根据CUDA版本选择安装命令（以CUDA 12.1为例）：

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

YOLOv8核心库：
```
pip install ultralytics opencv-python
```

三、快速上手：从推理到训练

1. 使用预训练模型推理

from ultralytics import YOLO

# 加载模型
model = YOLO("yolov8n.pt")  # 官方提供的轻量级模型

# 单张图片推理
results = model("bus.jpg", save=True, conf=0.5)
results.show()  # 显示检测结果

2. 命令行工具（CLI）实战

训练：

yolo detect train data=coco128.yaml model=yolov8n.pt epochs=100 imgsz=640

验证与预测：

yolo detect val model=best.pt  # 验证模型精度
yolo detect predict model=best.pt source=video.mp4  # 视频推理

模型导出（如ONNX）：

yolo export model=best.pt format=onnx  # 支持TensorRT、CoreML等格式

四、自定义数据集训练

1. 数据准备

标注格式：使用LabelImg等工具生成YOLO格式标签（class_id x_center y_center width height，数值需归一化）。

目录结构：

dataset/
├── images/
│   ├── train/
│   └── val/
└── labels/
    ├── train/
    └── val/

编写YAML配置文件（data.yaml）：

path: ./dataset
train: images/train
val: images/val
names: ['cat', 'dog']  # 类别名称

2. 启动训练

from ultralytics import YOLO

model = YOLO("yolov8n.yaml")  # 从零训练
# 或加载预训练模型微调：model = YOLO("yolov8n.pt")

results = model.train(data="data.yaml", epochs=50, imgsz=640, batch=16)

五、进阶技巧：模型调优与部署

1. 超参数优化

学习率调整：初始值设为0.01，通过lrf参数控制衰减策略，如lrf=0.01表示最终学习率为初始的1%。
数据增强：启用Mosaic（拼接四张图）和Mixup（图像混合），增强模型泛化能力：
```
augment: True
mosaic: 0.5  # 启用概率
mixup: 0.2
```

2. 模型部署

导出为TensorRT引擎：

yolo export model=best.pt format=engine device=0  # 需提前安装TensorRT

Python推理加速：

model.predict(source="input.jpg", half=True)  # 启用半精度推理

六、实战案例：车牌检测与识别

结合YOLOv8与EasyOCR，实现端到端的车牌识别：

车牌检测：

plate_model = YOLO("plate_detection.pt")
results = plate_model("car.jpg")
boxes = results[0].boxes.xyxy  # 获取车牌坐标

OCR识别：

from easyocr import Reader
reader = Reader(['en'])
plate_image = crop_image_by_box("car.jpg", boxes[0])
text = reader.readtext(plate_image)[0][1]  # 输出车牌号