PyTorch之CV

最新推荐文章于 2024-02-15 20:50:07 发布

Vector Jason

最新推荐文章于 2024-02-15 20:50:07 发布

阅读量373

点赞数

文章标签：深度学习计算机视觉 python

本文链接：https://blog.csdn.net/Vectorln/article/details/125943225

版权

引子：

鉴于本人方向偏于深度学习中的图像处理，在此详细说明一下该领域中常用的一些库函数和相关架构。

同时，通过前面的学习我们也发现经常会用到torchvision来调用预训练模型，加载数据集，对图片进行数据增强等操作，因此，torchvision正是主要使用的一个库函数。

torchvision.transforms：

考虑到输入数据进入神经网络的过程中，其维度具有限制条件，因此，对输入image进行归一化是必要的，这也可以理解为数学模型中常进行的数据预处理操作。此外，有时我们无法获取到足够多的数据，这将导致无法很好训练神经网络中成千上万个参数，所以，我们可以通过将图片进行翻转，缩小或放大等操作以实现数据量的扩大。

例如：

from torchvision import transforms
data_transform = transforms.Compose([
    transforms.ToPILImage(),   # 这一步取决于后续的数据读取方式，如果使用内置数据集则不需要
    transforms.Resize(image_size),
    transforms.ToTensor()
])

这一段代码即表示image预处理过程，详情其余操作代码可见torchvison官方文档。

torchvision.models

了解多种多样的模型之后，我们总会有个疑问——该不会需要手敲所有代码吧？答案是否定的，在torchvison.models中提供了一些在ImageNet-1k数据集中预训练好的模型供我们使用

具体可以点击以下链接查看各个模型在该数据集之下的准确率。TorchVision中各个模型准确率对比分析https://gitee.com/link?target=https%3A%2F%2Fpytorch.org%2Fvision%2Fstable%2Fmodels.html%23

Vector Jason

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch之CV

基于深度学习中的图像处理，本文主要讲解了torchvison下常用的部分函数，并对各个函数进行了说明，同时以当下常用的神经网络模型为例，进行了在ImageNet-1k数据集预训练下各个模型的准确率对比分析。...
复制链接

扫一扫