用Mask-RCNN训练自定义大小的数据集

最新推荐文章于 2023-03-23 18:49:47 发布

蹦跶的小羊羔

最新推荐文章于 2023-03-23 18:49:47 发布

阅读量7.8k

点赞数 3

分类专栏： Deep Learning

本文链接：https://blog.csdn.net/yql_617540298/article/details/81782685

版权

本文介绍了如何在使用Mask-RCNN训练自定义大小数据集时，修改源代码以适应不同尺寸的图像。针对Mask-RCNN要求输入图像尺寸一致的问题，提出了在train_shapes.ipynb中加载数据时自动获取图像尺寸并进行处理的方法，同时提供了处理不规则图像大小的Python代码参考链接。

摘要由CSDN通过智能技术生成

Mask-RCNN自动获取训练集中图像的长度和宽度，然后用于训练。

一、目前情况

用Mask-RCNN训练自己的数据集时，需要制定图片的长度和宽度，即

IMAGE_MIN_DIM = 448
IMAGE_MAX_DIM = 640

而在Mask_RCNN/mrcnn目录下model.py文件中第1815行到1819行代码

h, w = config.IMAGE_SHAPE[:2]
        if h / 2**6 != int(h / 2**6) or w / 2**6 != int(w / 2**6):
            raise Exception("Image size must be dividable by 2 at least 6 times "
                            "to avoid fractions when downscaling and upscaling."
                            "For example, use 256, 320, 384, 448, 512, ... etc. ")

需要将图像处理成指定长宽比例的图像然后才可以用于训练，并且训练集中的图像需要长度和宽度都需一致。

若训练集中的图像有长度和宽度不同时则不能训练，这样极不方便。

二、更改Mask-RCNN代码

在训练数据集的代码train_shapes.ipynb中，在load_shapes()中添加更改代码：

for i in range(count):
            # 获取图片宽和高
            filestr = imglist[

最低0.47元/天解锁文章

蹦跶的小羊羔

关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
21
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录