基于pytorch搭建神经网络的花朵种类识别（深度学习）

矜贵.

已于 2022-07-14 14:17:05 修改

阅读量1.8k

点赞数 3

分类专栏： pytorch学习文章标签：深度学习神经网络 pytorch

于 2022-07-14 09:23:34 首次发布

本文链接：https://blog.csdn.net/weixin_43646500/article/details/125777023

版权

基于pytorch搭建神经网络的花朵种类识别（深度学习）

文章目录

基于pytorch搭建神经网络的花朵种类识别（深度学习）
一．知识点
二、项目任务
三、程序结构介绍
四、程序内容说明
- 1.代码整洁操作说明
- 2.迁移学习
五、附录完整代码

项目源码网盘链接：https://pan.baidu.com/s/176-HRsaVQkiwTXK6KJg5Bw
提取码：0dng
项目码云链接： https://gitee.com/xian-polytechnic-university/python

一．知识点

1.特征提取、神经元逐层判断

在这里插入图片描述

2.中间层（隐藏层）

在这里插入图片描述

3.学习权值、神经元进行运算

返向传递：将输出值与正确答案进行比较，将误差传递回输出层回去（叫梯度，pytorch自动完成），从而计算每个权值的最优值，去进行更改。
Pytorch核心：Autograd包（完成自动梯度计算及返向传递）
在这里插入图片描述
训练一个模型的时候需要返向传递，用的时候不需要
TensorFlow：
定义运算符、定义运算、定义梯度、开启对话框、注入数据、进行运算。
Pytorch：
初始化、进行运算（变调式便运算）

二、项目任务

基于 pytorch 搭建神经网络分类模型识别花的种类，输入一张花的照片，输出显示最有可能的前八种花的名称和该种花的照片。

操作过程如下：

1.数据集预处理操作

(1)读取数据集数据
(2)构建神经网络的数据集
1）数据增强：torchvision中transforms模块自带功能，将数据集中照片进行旋转、翻折、放大…得到更多的数据
2）数据预处理：torchvision中transforms也帮我们实现好了，直接调用即可
3）处理好的数据集保存在DataLoader模块中，可直接读取batch数据在这里插入图片描述

2.网络模型训练操作

(1)迁移pytorch官网中models提供的resnet模型，torchvision中有很多经典网络架构，调用起来十分方便，并且可以用人家训练好的权重参数来继续训练，也就是所谓的迁移学习
(2)选择GPU计算、选择训练哪些层、优化器设置、损失函数设置…
(3)训练全连接层，前几层都是做特征提取的，本质任务目标是一致的，前面的先不动，先训练最后一层全连接层
(4)再训练所有层
在这里插入图片描述

3.预测种类操作

(1)加载训练好的模型，模型保存的时候可以带有选择性，例如在验证集中如果当前效果好则保存
(2)设置检测图像的数据
(3)设置展示界面并进行预测
在这里插入图片描述

三、程序结构介绍

在这里插入图片描述

1.flower_function/定义函数程序

（在该程序中定义相关函数，以便在其他程序中进行调用）

图像增强（数据集预处理处理）
处理照片数据函数
检测照片预处理函数
展示一张照片函数

2.flower_dataset/数据集处理程序

读取数据集（训练集测试集）数据
构建神经网络的数据集

3.flower_model网络模型训练程序

冻结神经网络权重函数
修改全连接层函数（官方）
训练模型函数
加载并修改models中提供的resnet模型open
开始训练全连接层（0-19）
再继续训练所有层（0-9）

4.flower_forecast预测程序

冻结神经网络权重函数
修改全连接层函数
加载测试模型
设置检测图像数据
设置展示界面

四、程序内容说明

1.代码整洁操作说明

两行“”“”“open、”“”“”end封装的是该模块的程序
#是单行注释

2.迁移学习

用相似的模型的权重初始化，修改全连接层，然后重新训练
pytorch->transforms->resnet->models

(1)一个文件程序写全部代码有两个问题：
1）功能分工不明确
2）每次都要重新跑训练网络
(2)模块化编程：将功能函数分别放到不同的程序中，程序中相互调，可以分别进行功能测试
(3)模块化编程两种方式：
A中：
import B
B.function
A中：
from B import function
function
(4)注意import循环重载：
利用pycharm这种IDE进行模块化编程，多个.py文件相互import容易发生循环重载
先了解下import的原理：
例：A中importB，当顺序执行A，遇到相关数据需要调用B时，停止执行A，去执行B，B执行完了再执行A，如果A、B相互调用的话会报错
解决办法：
当A中importB，当B又需要调用A时，把需要的A中参数定义、函数定义在B中再写一遍

五、附录完整代码

1.flower_function/定义函数程序

import numpy as np
import torch
import matplotlib.pyplot as plt
from PIL import Image

from torchvision import transforms, models


filename='checkpoint.pth'
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

"""""""""""""""图像增强（数据集预处理处理）open"""""""""""""""
#图像增强：将数据集中照片进行旋转、翻折、放大...得到更多的数据
#ImageFolder假设所有的文件按文件夹保存好，每个文件夹下面存贮同一类别的图片，文件夹的名字为分类的名字
data_transforms = {
     #data_transforms中指定了所有图像预处理操作,只需要修改训练集和验证集的名字后复制粘贴
    'train':
        transforms.Compose([transforms.RandomRotation(45),#随机旋转，-45到45度之间随机选
        transforms.CenterCrop(224),#从中心开始裁剪
        transforms.RandomHorizontalFlip(p=0.5),#随机水平翻转 选择一个概率概率
        transforms.RandomVerticalFlip(p=0.5),#随机垂直翻转
        transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1),#参数1为亮度，参数2为对比度，参数3为饱和度，参数4为色相
        transforms.RandomGrayscale(p=0.025),#概率转换成灰度率，3通道就是R=G=B
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])#均值，标准差
    ]),
    'valid':
        transforms.Compose([transforms.Resize(256),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
}
"""""""""""""""图像增强（数据集预处理处理）end"""""""""""""""


"""""""""""""""处理照片数据函数open"""""""""""""""
#注意tensor的数据需要转换成numpy的格式，而且还需要还原回标准化的结果
def im_convert(tensor):

    image = tensor.to("cpu").clone().detach()
    image = image.numpy().squeeze()
    # 还原回h，w，c
    image = image.transpose(1, 2, 0)
    # 被标准化过了，还原非标准化样子
    image = image * np.array((0.229, 0.224, 0.225)) + np.array((0.485, 0.456, 0.406))
    image = image.clip(0, 1)

    return image
"""""""""""""""处理照片数据函数end"""""""""""""""


"""""""""""""""检测照片预处理函数open"""""""""""""""
def process_image(image_path):
    # 读取测试数据
    img = Image.open(image_path)
    # Resize,thumbnail方法只能进行缩小，所以进行了判断
    if img.size[0] > img.size[1]:
        img.thumbnail((10000, 256))
    else:
        img.thumbnail((256, 10000))
    # Crop操作，再裁剪
    left_margin = (img.width - 224) / 2
    bottom_margin = (img.height - 224) / 2
    right_margin = left_margin + 224
    top_margin = bottom_margin + 224
    img = img.crop((left_margin, bottom_margin, right_margin,
                    top_margin))
    # 相同的预处理方法
    img = np.array(img) / 255
    mean = np.array([0.485, 0.456, 0.406])  # provided mean
    std = np.array([0.229, 0.224, 0.225])  # provided std
    img = (img - mean) / std

    # 注意颜色通道应该放在第一个位置
    img = img.transpose((2, 0, 1))

    return img
"""""""""""""""检测照片预处理函数end"""""""""""""""


""

最低0.47元/天解锁文章

矜贵.

关注

3
点赞
踩
49

收藏

觉得还不错? 一键收藏
3
评论
基于pytorch搭建神经网络的花朵种类识别（深度学习）

返向传递：将输出值与正确答案进行比较，将误差传递回输出层回去（叫梯度，pytorch自动完成），从而计算每个权值的最优值，去进行更改。Pytorch核心：Autograd包（完成自动梯度计算及返向传递）训练一个模型的时候需要返向传递，用的时候不需要TensorFlow：定义运算符、定义运算、定义梯度、开启对话框、注入数据、进行运算。Pytorch：初始化、进行运算（变调式便运算）基于 pytorch 搭建神经网络分类模型识别花的种类，输入一张花的照片，输出显示最有可能的前八种花的名称和该种花
复制链接

扫一扫