CV
文章平均质量分 91
Computer Vision
Iareges
这个作者很懒,什么都没留下…
展开
-
PyTorch搭建LSTM实现服装分类(FashionMNIST)
LSTM + FashionMNIST原创 2022-06-23 22:58:00 · 875 阅读 · 12 评论 -
计算机视觉系列(七)——迁移学习
目录一、迁移学习与微调二、如何寻找预训练的模型?三、初始化模型四、将 ResNet 迁移到 CIFAR-10 上一、迁移学习与微调ImageNet 数据集大约有 120w 个样本,类别数为 1000;MNIST 数据集只有 6w 个样本,类别数为 10。然而,我们平常接触到的数据集的规模通常在这两者之间。假如我们想识别图片中不同类型的椅子,然后向用户推荐购买链接。 一种可能的方法是首先识别 100 把普通椅子,为每把椅子拍摄 1000 张不同角度的图像,然后在收集的图像数据集上训练一个分类模型。 尽管原创 2022-05-16 17:08:11 · 1829 阅读 · 8 评论 -
计算机视觉系列(六)——图像增强
目录一、图像增强二、torchvision.transforms 介绍二、图像展示三、翻转与旋转一、图像增强大型数据集是成功应用深度神经网络的先决条件。 图像增强(Image Augmentation)在对训练图像进行一系列的随机变化之后,生成相似但不同的训练样本,从而扩大了训练集的规模。此外,应用图像增强的原因是,随机改变训练样本可以减少模型对某些属性的依赖,从而提高模型的泛化能力。例如,我们可以以不同的方式裁剪图像,使感兴趣的对象出现在不同的位置,减少模型对于对象出现位置的依赖。 我们还可以调整亮原创 2022-05-16 12:32:13 · 4892 阅读 · 6 评论 -
计算机视觉系列(五)——ResNet的实现
目录一、Residual Block二、ResNet 架构三、训练/测试 ResNet附录:完整代码一、Residual Block残差块有以下两种:实现如下:import torchfrom torch import nnimport torch.nn.functional as Fclass Residual(nn.Module): def __init__(self, in_channels, out_channels, stride=1, conv_1x1=False)原创 2022-05-15 12:02:33 · 1026 阅读 · 9 评论 -
计算机视觉系列(四)——GoogLeNet
目录一、GoogLeNet 简介二、Inception 块三、GoogLeNet 架构四、训练/测试 GoogLeNet附录:完整代码一、GoogLeNet 简介GoogLeNet 吸收了 NiN 中串联网络的思想,并在此基础上做了改进。GoogLeNet 的一个观点是,有时使用不同大小的卷积核的组合是有利的。在本节中,我们将介绍一个稍微简化的 GoogLeNet 版本。二、Inception 块在 GoogLeNet 中,基本的卷积块被称为 Inception 块,其结构如下:Inceptio原创 2022-05-14 13:35:55 · 748 阅读 · 7 评论 -
计算机视觉系列(三)——VGG与NiN
目录一、VGG(使用块的网络)1.1 VGG 简介1.2 搭建 VGG1.3 训练/测试 VGG1.4 VGG 完整代码二、NiN(网络中的网络)一、VGG(使用块的网络)1.1 VGG 简介虽然 AlexNet 证明深层神经网络卓有成效,但由于它的结构 “混乱”,无法提供一个通用的模板来指导后续的研究人员设计新的网络。为了使神经网络的结构看起来更加规整,我们可以将若干卷积层和一个汇聚层封装成一个块,再将若干个块与全连接层连接起来以形成一个完整的网络。使用块的想法首先出现在牛津大学的视觉几何组(V原创 2022-05-14 10:31:48 · 1049 阅读 · 5 评论 -
计算机视觉系列(二)——AlexNet
目录一、LeNet 简介二、搭建 LeNet三、训练 LeNet附录:完整代码一、LeNet 简介LeNet(又称 LeNet-5)是最早发布的卷积神经网络之一,因其在计算机视觉任务中的高效性能而受到广泛关注。 这个模型是由Yann LeCun在1989年提出的(并以其命名),目的是识别图像中的手写数字(灰度图,即单通道图像)。LeNet-5 中的数字 555 指的是该网络一共有五层,其中包括:两个卷积层(Conv)三个全连接层(Fully Connected,简称FC)注意,我们通常把一原创 2022-05-12 15:19:50 · 973 阅读 · 17 评论 -
计算机视觉系列(一)——CNN基础
目录一、~~卷积~~ (互相关)运算1.1 边缘检测1.2 nn.Conv2d1.3 卷积核学习1.4 特征图与感受野一、卷积 (互相关)运算严格来讲,卷积运算实际上是互相关(cross-correlation)运算,如下图所示:设输入大小为 (nh,nw)(n_h,n_w)(nh,nw),卷积核大小为 (kh,kw)(k_h,k_w)(kh,kw),则输出大小为 (nh−kh+1,nw−kw+1)(n_h-k_h+1,n_w-k_w+1)(nh−kh+1,nw−kw+1)接下来实原创 2022-05-11 17:46:54 · 864 阅读 · 7 评论 -
PyTorch学习笔记(五)——多层感知机的实现
目录一、torchvision简介一、FashionMNIST数据集一、torchvision简介有不少基于 Pytorch 的工具箱都非常实用,例如处理自然语言的 torchtext,处理音频的 torchaudio 以及处理图像视频的 torchvision。torchvision 主要包含了一些流行的数据集,模型架构和常用的图像转换功能等。本节将聚焦于数据集的使用以及相关的图像转换功能。一、FashionMNIST数据集...原创 2022-05-08 18:03:29 · 1396 阅读 · 18 评论 -
PyTorch学习笔记(四)——torchvision工具箱
目录一、torchvision简介二、torchvision.transforms2.1 `Image` 、`Tensor` 与 `ndarray` 之间的相互转化2.1.1 ToTensor()2.1.2 PILToTensor()2.1.3 ToPILImage()2.2 常见的图像操作2.2.1 TF.adjust_brightness()2.2.2 TF.adjust_contrast()2.2.3 TF.adjust_saturation()2.2.4 TF.adjust_sharpness()2原创 2022-05-07 15:11:15 · 810 阅读 · 15 评论 -
Pillow速通教程
目录一、安装二、使用2.1 初识Image类2.1.1 Image.open()2.1.2 Image对象的各个属性2.1.3 Image.new()一、安装pip install pillow二、使用2.1 初识Image类Pillow 中最重要的就是 Image 类了,导入方法如下:from PIL import Image2.1.1 Image.open()假设当前工作目录下有一个 pics 文件夹,其中存放着 1.png 图片,若要打开它,只需img = Image.open(原创 2022-05-06 22:52:24 · 852 阅读 · 16 评论