基于 YOLOv8 的图像分割 demo

最新推荐文章于 2024-09-18 11:10:31 发布

小北的北

最新推荐文章于 2024-09-18 11:10:31 发布

阅读量597

点赞数

文章标签： YOLO

本文链接：https://blog.csdn.net/weixin_38739735/article/details/134522376

版权

介绍

分割是计算机视觉中的一个关键任务，在医学成像、机器人技术和自动驾驶汽车等领域具有广泛的应用。YOLO（You Only Look Once）是一组以其速度和精度而著名的目标检测模型。要使用YOLO进行分割，可以扩展YOLO目标检测模型，以预测图像中每个找到的对象的像素级掩码。

在这篇博客文章中，我们将探讨如何在实际应用中使用YOLO进行分割。我们将讨论的主题包括：

选择预训练的YOLO模型
训练YOLO模型
评估模型

为什么使用YOLO进行分割？

使用YOLO进行分割有各种好处。YOLO模型速度快，适用于实时使用：

速度：YOLO模型非常快，适用于实时应用。
准确性：YOLO模型也非常准确，在许多分割基准测试中取得了最先进的结果。
鲁棒性：YOLO模型对噪声和遮挡具有鲁棒性，适用于具有挑战性的现实世界环境。

YOLO分割的实际应用

YOLO分割具有各种实际应用，包括医学成像和机器人技术：

医学成像：YOLO图像分析可以识别医学图像中的肿瘤和其他异常。这些数据可以帮助医生诊断疾病并制定治疗计划。
机器人技术：YOLO分割可以用于将区域中的对象分开，以便机器人可以安全高效地与它们交互。例如，机器人可以应用YOLO分割来选择和放置存储设施中的物品，或者探索拥挤的环境。
自动驾驶：YOLO分割可以分割道路上的汽车、行人和其他物体，从而帮助自动驾驶汽车安全导航。

如何在图像和视频中使用YOLO

步骤1：安装必要的库

pip install opencv-python ultralytics

步骤2：导入库

from ultralytics import YOLO
import random
import cv2
import numpy as np

步骤3：选择您的模型

model = YOLO("yolov8m-seg.pt")

您可以在此网站上比较不同的模型并权衡它们各自的优缺点：

https://docs.ultralytics.com/tasks/segment/#models

在这种情况下，我们选择了yolov8m-seg.pt。

步骤4：使用YOLOv8分割图像中的对象

img = cv2.imread("YourImagePath")
# if you want all classes
yolo_classes = list(model.names.values())
classes_ids = [yolo_classes.index(clas) for clas in yolo_classes]


conf = 0.5


results = model.predict(img, conf=conf)
colors = [random.choices(range(256), k=3) for _ in classes_ids]
print(results)
for result in results:
    for mask, box in zip(result.masks.xy, result.boxes):
        points = np.int32([mask])
        # cv2.polylines(img, points, True, (255, 0, 0), 1)
        color_number = classes_ids.index(int(box.cls[0]))
        cv2.fillPoly(img, points, colors[color_number])

步骤5：保存和绘制结果图像

cv2.imshow("Image", img)
cv2.waitKey(0)
cv2.imwrite("YourSavePath", img)

完整的代码如下：

from ultralytics import YOLO
import random
import cv2
import numpy as np


model = YOLO("yolov8m-seg.pt")
img = cv2.imread("YourImagePath")


# if you want all classes
yolo_classes = list(model.names.values())
classes_ids = [yolo_classes.index(clas) for clas in yolo_classes]


conf = 0.5


results = model.predict(img, conf=conf)
colors = [random.choices(range(256), k=3) for _ in classes_ids]
print(results)
for result in results:
    for mask, box in zip(result.masks.xy, result.boxes):
        points = np.int32([mask])
        # cv2.polylines(img, points, True, (255, 0, 0), 1)
        color_number = classes_ids.index(int(box.cls[0]))
        cv2.fillPoly(img, points, colors[color_number])


cv2.imshow("Image", img)
cv2.waitKey(0)


cv2.imwrite("YourSavePath", img)

· END ·

HAPPY LIFE