零基础入门cv03︱Python学习笔记

最新推荐文章于 2022-11-17 15:46:59 发布

PenguinAsHeathen

最新推荐文章于 2022-11-17 15:46:59 发布

阅读量176

点赞数

分类专栏： Python学习笔记文章标签：机器学习神经网络卷积

本文链接：https://blog.csdn.net/m0_46384386/article/details/106368078

版权

1.卷积神经网络（CNN）介绍一类特殊的人工神经网络，是深度学习中一个重要分支。较传统计算学习算法，精度和速度较高在计算机视觉领域，CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型cnn每一层由众多的卷积核组成，每个卷积核对输入的像素进行卷积操作，得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野，并缩减图像的尺寸。cnn是一种层次模型，输入的是原始的像素数据。cnn通过卷积（convolution）、池化（pooling）、非线性激活函数（non-linear activ

摘要由CSDN通过智能技术生成

1.卷积神经网络（CNN）介绍

一类特殊的人工神经网络，是深度学习中一个重要分支。
较传统计算学习算法，精度和速度较高
在计算机视觉领域，CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型

cnn每一层由众多的卷积核组成，每个卷积核对输入的像素进行卷积操作，得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野，并缩减图像的尺寸。
在这里插入图片描述
cnn是一种层次模型，输入的是原始的像素数据。cnn通过卷积（convolution）、池化（pooling）、非线性激活函数（non-linear activation function）和全连接层（fully connected layer）构成。

LeNet网络结构，非常经典的字符识别模型。两个卷积层，两个池化层，两个全连接层组成。卷积核5*5，stride=1，池化层使用最大池化。

通过多次卷积和池化，cnn的最后一层将输入的图像像素映射为具体的输出。如在分类任务中会转换为不同类别的概率输出，然后计算真实标签与cnn模型的预测结果的差异，并通过反响传播更新每层的参数，并在更新完成后再次前向传播，如此反复直到训练完成。

与传统机器学习模型相比，cnn具有一种端到端（end to end）的思路。在cnn训练的过程中是直接从图像像素到最终的输出，并不涉及到具体的特征提取和构建模型的过程，也不需要人工的参与。

2.cnn发展

网络模型结构越深、网络参数越多模型的精度越优。较典型的是alexnet、vgg、inceptionv3、resnet的发展脉络。
lenet - 5
alexnet
vgg - 16
inception - v1
resnet - 50

3.pytorch构建cnn模型
在pytorch中构建cnn模型较简单，只需要定义好模型的参数和正向传播即可，pytorch会根据正向传播自动计算反向传播。
本cnn模型包括两个卷积层，最后并联6个全连接层进行分类。

import torch
torch.manual_seed(0)
torch.backends.cudnn.deterministic = False
torch.backends.cudnn.benchmark = True

import torchvision.models as models
import torchvision.transforms as transforms
import torchvision.datasets as datasets
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.autograd import Variable
from torch.utils.data.dataset import Dataset

# 定义模型
class SVHN_Model1(nn.Module):
    def __init__(self):
        super(SVHN_Model1, self).__init__()
        # CNN提取特征模块
        self.cnn = nn.Sequential(
            nn.Conv2d

最低0.47元/天解锁文章

PenguinAsHeathen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
零基础入门cv03︱Python学习笔记

1.卷积神经网络（CNN）介绍一类特殊的人工神经网络，是深度学习中一个重要分支。较传统计算学习算法，精度和速度较高在计算机视觉领域，CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型cnn每一层由众多的卷积核组成，每个卷积核对输入的像素进行卷积操作，得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野，并缩减图像的尺寸。cnn是一种层次模型，输入的是原始的像素数据。cnn通过卷积（convolution）、池化（pooling）、非线性激活函数（non-linear activ
复制链接

扫一扫