基于 Alexnet 的服装图像模式识别系统的设计与实现

最新推荐文章于 2024-05-18 11:07:24 发布

李逍遥敲代码

最新推荐文章于 2024-05-18 11:07:24 发布

阅读量1.1k

点赞数

分类专栏：模式识别综合应用代码全文章标签： cnn 深度学习人工智能 python 神经网络

本文链接：https://blog.csdn.net/weixin_41984456/article/details/125093920

版权

题目的主要研究内容工作的主要描述

本文设计实现了基于 Alexnet 的服装图像识别和分类系统，使用网络爬虫得到的图片进行了测试，对于模型中参数进行了调整以在本实验所用数据集上得到更好的效果，并且增加 CNN 模型作为对比项，结果显示使用 Alexnet 模型能够极好地胜任图像的识别和分类任务。本系统使用了 Fashion-MNIST 数据集，输出的总类别数为 10。

模型简介

本设计采用 Alexnet 模型，Alexnet 模型共有五个卷积层、三个池化层和三个全连接层。其中五个卷积层和位于第一、第二、第五卷积层之后的池化层实现了特征提取功能，后三个全连接层把最后一个池化层的输出作为输入，输出对于待预测图像的预测概率值，Alexnet 模型结构图如图 1 所示。

1. 1. 系统流程图

图 1 Alexnet 网络结构图

本设计将待预测图片作为输入传入Alexnet 模型，经过各卷积层、池化层和全连接层的计算转化后输出预测值，具体流程图如图 2 所示。

图 2 系统流程图

1. 题目研究的工作基础或实验条件
硬件环境

gpu 1080 Ti

软件环境

python 3.7

1. 数据集描述

本设计使用的是 Fashion-MNIST（服饰数据集），是经典 MNIST 数据集的替代，MNIST 数据集包含手写数字（阿拉伯数字）的图像，Fashion MNIST/ 服饰数据集包含 10 种类别，70000 张灰度图像，其中包含 60,000 个示例的训练集和 10,000 个示例的测试集，每个示例都是一个 28x28 灰度图像， Fashion MNIST 比常规 MNIST 手写数据将更具挑战性。两者数据集都较小，主要适用于初学者学习或验证某个算法可否正常运行，是测试和调试代码的良好起点。

1. 特征提取过程描述

Alexnet 网络结构如图所示，它是由 5 个卷积层和 3 个全连接层组成，前五个卷积层主要用于特征提取，其中第一、第二、第五卷积层后面各有一个池化层；后三个全连接层用于分类识别。本小节主要介绍用于特征提取的卷积层及池化层，从第一卷积层开始，每层输出作为输入传入下一层，各层具

体信息如表 1 所示：

表 1 Alexnet 模型中特征提取的各层具体信息表

Layer_

name

Conv1

Pool1

Conv2

Pool2

Conv3

Conv4

Conv5

Pool3

输入图像大小

224 *

224 * 3

55 * 55

* 96

27 * 27

* 96

27 * 27

* 256

最低0.47元/天解锁文章

李逍遥敲代码

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于 Alexnet 的服装图像模式识别系统的设计与实现

本文设计实现了基于 Alexnet 的服装图像识别和分类系统，使用网络爬虫得到的图片进行了测试，对于模型中参数进行了调整以在本实验所用数据集上得到更好的效果，并且增加 CNN 模型作为对比项，结果显示使用 Alexnet 模型能够极好地胜任图像的识别和分类任务。本系统使用了 Fashion-MNIST 数据集，输出的总类别数为 10。本设计采用 Alexnet 模型，Alexnet 模型共有五个卷积层、三个池化层和三个全连接层。其中五个卷积层和位于第一、第二、第五卷积层之后的池化层实现了特征提取功能，后三个
复制链接

扫一扫