pytorch 从头开始faster-rcnn（二）：数据集处理

最新推荐文章于 2024-10-11 07:43:36 发布

冰菓(笑)

最新推荐文章于 2024-10-11 07:43:36 发布

阅读量2.2k

点赞数 3

分类专栏：目标检测 faster-rcnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a362682954/article/details/82785727

版权

本文介绍了如何在PyTorch中从头开始处理Faster R-CNN目标检测数据集。内容包括加载图像和XML标签，特别是处理多个bounding box，将图像转换为PyTorch所需的固定数据格式，并封装成数据读取类，最后配置迭代器的batch_size。

摘要由CSDN通过智能技术生成

一个神经网络的开始首先是要对数据进行处理。

目标检测图像分为两个部分，一个是原始图像，另外一个是标志的xml文件。

由于pytorch数据使用迭代器加载，所以处理都是一张一张图像的处理。

1.加载图像和标签。

标签包括boundingbox和其名称标签，由于boundingbox和其标签有多个，所有使用循环读取。返回图像及其标签。

    def get_example(self, i):
        """Returns the i-th example.

        Returns a color image and bounding boxes. The image is in CHW format.
        The returned image is RGB.

        Args:
            i (int): The index of the example.

        Returns:
            tuple of an image and bounding boxes

        """
        id_ = self.ids[i]
        anno = ET.parse(
            os.path.join(self.data_dir, 'Annotations', id_ + '.xml'))
        bbox = list()
        label = list()
        difficult = list()
        for obj in anno.findall('object'):
            # when in not using difficult split, and the object is
            # difficult, skipt it.

最低0.47元/天解锁文章

关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

冰菓(笑) CSDN认证博客专家 CSDN认证企业博客

码龄9年

132: 原创

3万+: 周排名

130万+: 总排名

50万+: 访问

: 等级

6039: 积分

154: 粉丝

225: 获赞

236: 评论

911: 收藏

私信

关注

热门文章

分类专栏

NLP 1篇
软件环境安装 2篇
深度学习 8篇
tensorflow 4篇
部署
爬虫 1篇
darknet 1篇
ocr 1篇
机器学习 13篇
python 17篇
ubuntu 8篇
研电赛 4篇
医疗图像 6篇
pytorch 24篇
opencv 12篇
论文修改 3篇
incremental learning 6篇
keras 7篇
目标检测 40篇
算法 21篇
C++ 23篇
知识蒸馏 2篇
faster-rcnn 7篇
YOLOV3 5篇
每周论文阅读 3篇
图像处理 7篇

最新评论

pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 如果loss依然为负数也没有关系，（我猜想大概率仍然是smooth取得不合理）。直接用负loss一样可以实现优化： class dice_coef(nn.Module): def __init__(self): super(dice_coef, self).__init__() def forward(self, y_true, y_pred, smooth=1e-7): y_true_f = y_true.flatten() y_pred_f = y_pred.flatten() intersection = torch.sum(y_true_f * y_pred_f) return (2. * intersection + smooth) / (torch.sum(y_true_f) + torch.sum(y_pred_f) + smooth) class dice_coef_multilabel(nn.Module): def __init__(self): super(dice_coef_multilabel, self).__init__() def forward(self, y_true, y_pred, numLabels=3): dice = 0 for index in range(3): dice -= dice_coef()(y_true[:, index], y_pred[:, index]) return dice
pytorch: DiceLoss MulticlassDiceLoss
YorkCOSYAO: 出现负值的原因是因为smooth，参考用户‘孙良怀’的评论：loss = 2 * (intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 我认为应该写作： loss = (2*intersection.sum(1) + smooth) / (input_flat.sum(1) + target_flat.sum(1) + smooth) 。smooth应该加在括号里面。不然分子加了两个smooth，分母只加了一个
pytorch 自己的图片数据处理成可以训练的图片类型
编程进阶0.1: from torch.utils.data import Dataset import numpy as np class Dataset(Dataset): def __init__(self, path_img, path_target, transforms=None): self.train = path_img self.targets = path_target self.transforms = transforms def __len__(self): return len(self.train) def __getitem__(self, idx): img = self.train[idx] target = self.targets[idx] if self.transforms: img = self.transforms(img) target = self.transforms(target) return img, target 可以说一下这段代码的原理吗？
关于pytorch 模型复制的一些问题
cyh19971997: 在循环里deepcopy造成显存飙升最后CUDA 显存炸了。你遇见过吗
pytorch 从头开始faster-rcnn 最后：使用自己的数据集
晴明大大: 好久了，我也忘了

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。