深度学习预处理不同尺寸的图像的方法

不要影响我叠Q

于 2021-08-19 19:57:22 发布

阅读量2.5k

点赞数 1

分类专栏： pytorch 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15054345/article/details/119809658

版权

pytorch 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

代码源自mask-rcnn模型，github地址如下：https://github.com/multimodallearning/pytorch-mask-rcnn/blob/809abba590db89779ac02c42286135f18ea08b53/utils.py#L270

需要将图像处理成正方形，代码如下：

def resize_image(image, min_dim=None, max_dim=None, padding=False):
    h, w = image.shape[:2]
    window = (0, 0, h, w)
    scale = 1

    # Scale?
    if min_dim:
        # Scale up but not down
        scale = max(1, min_dim / min(h, w))
    # Does it exceed max dim?
    if max_dim:
        image_max = max(h, w)
        if round(image_max * scale) > max_dim:
            scale = max_dim / image_max
    # Resize image and mask
    if scale != 1:
        image = scipy.misc.imresize(
            image, (round(h * scale), round(w * scale)))
    # Need padding?
    if padding:
        # Get new height and width
        h, w = image.shape[:2]
        top_pad = (max_dim - h) // 2
        bottom_pad = max_dim - h - top_pad
        left_pad = (max_dim - w) // 2
        right_pad = max_dim - w - left_pad
        padding = [(top_pad, bottom_pad), (left_pad, right_pad), (0, 0)]
        image = np.pad(image, padding, mode='constant', constant_values=0)
        window = (top_pad, left_pad, h + top_pad, w + left_pad)
    return image, window, scale, padding

针对不同尺寸的图像，直接将原始图像作为输入，并将batchsize设置为1，然后使用梯度累积变相扩充batchsize，不过我试过这种方法效果不是很好。下次试试上面这个resize将原图变成正方形，观察其效果如何

不要影响我叠Q

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

不要影响我叠Q CSDN认证博客专家 CSDN认证企业博客

码龄10年

211: 原创

9万+: 周排名

7455: 总排名

47万+: 访问

: 等级

5229: 积分

388: 粉丝

770: 获赞

98: 评论

1250: 收藏

私信

关注

分类专栏

最新评论

vscode下载历史版本插件包
BrianJustin*: “再去插件对应的github项目地址找到vscode版本对应的插件版本信息”虽然这步不知道怎么操作，但幸好我的版本和博主一致，直接抄你找的就行了
wsl中的ubuntu安装docker踩坑记
新手小白12138--: 您好我service docker status显示running, 但是 service --statues-all 又显示没开启，运行hello world也显示未启动 ddocker daemon，请问您知道这是什么原因吗？ log如下： [code=python] (glip) root@fdb7e138bfe8:~/data3/zhengby/YOLO-World-master# service docker start && service docker status * Starting Docker: docker [ OK ] * Docker is running (glip) root@fdb7e138bfe8:~/data3/zhengby/YOLO-World-master# service --status-all [ - ] apparmor [ - ] cron [ - ] dbus [ - ] docker [/code]
《intel开发手册卷3》读书笔记1
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
3D Slicer导入标签与查看标签
咿喃小记: 请问可以批量这样导出吗？
3D Slicer将分割结果保存
咿喃小记: 请问3d slicer可以批量这样导出吗？

大家在看

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。