PyTorch之CV

引子:

        鉴于本人方向偏于深度学习中的图像处理,在此详细说明一下该领域中常用的一些库函数和相关架构。

        同时,通过前面的学习我们也发现经常会用到torchvision来调用预训练模型,加载数据集,对图片进行数据增强等操作,因此,torchvision正是主要使用的一个库函数。

torchvision.transforms:

        考虑到输入数据进入神经网络的过程中,其维度具有限制条件,因此,对输入image进行归一化是必要的,这也可以理解为数学模型中常进行的数据预处理操作。此外,有时我们无法获取到足够多的数据,这将导致无法很好训练神经网络中成千上万个参数,所以,我们可以通过将图片进行翻转,缩小或放大等操作以实现数据量的扩大。

例如:

from torchvision import transforms
data_transform = transforms.Compose([
    transforms.ToPILImage(),   # 这一步取决于后续的数据读取方式,如果使用内置数据集则不需要
    transforms.Resize(image_size),
    transforms.ToTensor()
])

        这一段代码即表示image预处理过程,详情其余操作代码可见torchvison官方文档。

torchvision.models

        了解多种多样的模型之后,我们总会有个疑问——该不会需要手敲所有代码吧?答案是否定的,在torchvison.models中提供了一些在ImageNet-1k数据集中预训练好的模型供我们使用

      具体可以点击以下链接查看各个模型在该数据集之下的准确率。TorchVision中各个模型准确率对比分析icon-default.png?t=M666https://gitee.com/link?target=https%3A%2F%2Fpytorch.org%2Fvision%2Fstable%2Fmodels.html%23

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值