基于 YOLOv8 的图像分割 demo

点击上方“小白学视觉”,选择加"星标"或“置顶

 
 
重磅干货,第一时间送达

介绍

分割是计算机视觉中的一个关键任务,在医学成像、机器人技术和自动驾驶汽车等领域具有广泛的应用。YOLO(You Only Look Once)是一组以其速度和精度而著名的目标检测模型。要使用YOLO进行分割,可以扩展YOLO目标检测模型,以预测图像中每个找到的对象的像素级掩码。

在这篇博客文章中,我们将探讨如何在实际应用中使用YOLO进行分割。我们将讨论的主题包括:

  • 选择预训练的YOLO模型

  • 训练YOLO模型

  • 评估模型

为什么使用YOLO进行分割?

使用YOLO进行分割有各种好处。YOLO模型速度快,适用于实时使用:

  • 速度:YOLO模型非常快,适用于实时应用。

  • 准确性:YOLO模型也非常准确,在许多分割基准测试中取得了最先进的结果。

  • 鲁棒性:YOLO模型对噪声和遮挡具有鲁棒性,适用于具有挑战性的现实世界环境。

YOLO分割的实际应用

YOLO分割具有各种实际应用,包括医学成像和机器人技术:

  • 医学成像:YOLO图像分析可以识别医学图像中的肿瘤和其他异常。这些数据可以帮助医生诊断疾病并制定治疗计划。

  • 机器人技术:YOLO分割可以用于将区域中的对象分开,以便机器人可以安全高效地与它们交互。例如,机器人可以应用YOLO分割来选择和放置存储设施中的物品,或者探索拥挤的环境。

  • 自动驾驶:YOLO分割可以分割道路上的汽车、行人和其他物体,从而帮助自动驾驶汽车安全导航。

如何在图像和视频中使用YOLO

步骤1:安装必要的库

pip install opencv-python ultralytics

步骤2:导入库

from ultralytics import YOLO
import random
import cv2
import numpy as np

步骤3:选择您的模型

model = YOLO("yolov8m-seg.pt")

您可以在此网站上比较不同的模型并权衡它们各自的优缺点:

https://docs.ultralytics.com/tasks/segment/#models

在这种情况下,我们选择了yolov8m-seg.pt。

步骤4:使用YOLOv8分割图像中的对象

img = cv2.imread("YourImagePath")
# if you want all classes
yolo_classes = list(model.names.values())
classes_ids = [yolo_classes.index(clas) for clas in yolo_classes]


conf = 0.5


results = model.predict(img, conf=conf)
colors = [random.choices(range(256), k=3) for _ in classes_ids]
print(results)
for result in results:
    for mask, box in zip(result.masks.xy, result.boxes):
        points = np.int32([mask])
        # cv2.polylines(img, points, True, (255, 0, 0), 1)
        color_number = classes_ids.index(int(box.cls[0]))
        cv2.fillPoly(img, points, colors[color_number])

步骤5:保存和绘制结果图像

cv2.imshow("Image", img)
cv2.waitKey(0)
cv2.imwrite("YourSavePath", img)

完整的代码如下:

from ultralytics import YOLO
import random
import cv2
import numpy as np


model = YOLO("yolov8m-seg.pt")
img = cv2.imread("YourImagePath")


# if you want all classes
yolo_classes = list(model.names.values())
classes_ids = [yolo_classes.index(clas) for clas in yolo_classes]


conf = 0.5


results = model.predict(img, conf=conf)
colors = [random.choices(range(256), k=3) for _ in classes_ids]
print(results)
for result in results:
    for mask, box in zip(result.masks.xy, result.boxes):
        points = np.int32([mask])
        # cv2.polylines(img, points, True, (255, 0, 0), 1)
        color_number = classes_ids.index(int(box.cls[0]))
        cv2.fillPoly(img, points, colors[color_number])


cv2.imshow("Image", img)
cv2.waitKey(0)


cv2.imwrite("YourSavePath", img)
下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值