常见数据集格式+数据集标注

最新推荐文章于 2025-03-18 17:50:42 发布

布兹学长

最新推荐文章于 2025-03-18 17:50:42 发布

阅读量6.2k

点赞数 2

分类专栏： pytorch 文章标签：深度学习人工智能目标检测

本文链接：https://blog.csdn.net/booze_/article/details/125756005

版权

pytorch 专栏收录该内容

23 篇文章

订阅专栏

文章目录

一、什么是目标检测？

简单的来说就是，识别出目标的位置+类别。
例如：
人脸检测就是以人脸为目标进行检测
在这里插入图片描述
文字检测就是以文字为目标进行检测

目前主流的目标检测，都是以矩形框的形式进行输出，就是用矩形框将检测到的目标框出，但是这样的话精度就没有特别高，框内可能还有其他的目标。

语义分割：具有更高精度
在这里插入图片描述

二、常见数据集

四、pytorch读取coco数据集

读取源码：

import torchvision
from PIL import ImageDraw

coco_data = torchvision.datasets.CocoDetection(
				root="./val2007",# 存放图片的文件夹路径
                annFile="./instances_val2017.json",  # 标注文件的路径
                                               )


# 第一个元素是PIL image,第二个元素是标注
image,info = coco_data[0]
# 创建ImageDraw对象用于绘制矩形框
image_handler = ImageDraw.ImageDraw(image)

# 从标注信息中取出标注的坐标位置
for annotation in info:
	# 获取标注位置
    x_min,y_min,width,height = annotation["bbox"]
    # 在取出的第一张图片上绘制标注矩形框
    image_handler.rectangle((x_min,y_min),(x_min+width,y_min+height))

image.show()