【深度学习】AlexNet原理解析及实现

最新推荐文章于 2025-03-25 18:03:14 发布

大姨妈V

最新推荐文章于 2025-03-25 18:03:14 发布

阅读量3.3w

点赞数 30

分类专栏：深度学习从零开始学习卷积神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012679707/article/details/80793916

版权

本文详细解析了AlexNet深度学习模型的结构、特点和技术创新，包括ReLU激活函数、Dropout、最大池化和LRN层。还介绍了如何使用TensorFlow在CPU环境下搭建AlexNet，以及训练和测试过程中的观察。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【深度学习】AlexNet原理解析及实现

Alex提出的alexnet网络结构模型，在imagenet2012图像分类challenge上赢得了冠军。

要研究CNN类型DL网络模型在图像分类上的应用，就逃不开研究alexnet，这是CNN在图像分类上的经典模型。

一、Alexnet结构

alexNet为8层深度网络，其中5层卷积层和3层全连接层，不计LRN层和池化层。如下图所示：

图 Alexnet结构

详解各层训练参数的计算：

前五层：卷积层

后三层：全连接层

整体计算图：

二、结构分析

AlexNet每层的超参数如下图所示，其中输入尺寸为227*227，第一个卷积使用较大的核尺寸11*11，步长为4，有96个卷积核；紧接着一层LRN层；然后是最大池化层，核为3*3，步长为2。这之后的卷积层的核尺寸都比较小，5*5或3*3，并且步长为1，即扫描全图所有像素；而最大池化层依然为3*3，步长为2.

我们可以发现，前几个卷积层的计算量很大，但参数量很小，只占Alexnet总参数的很小一部分。这就是卷积层的优点！通过较小的参数量来提取有效的特征。

要注意，论文中指出，如果去掉任何一个卷积层，都会使网络的分类性能大幅下降。

三、AlexNet的新技术点

AlexNet的新技术点（即大牛论文的contribution），如下：

（1）ReLU作为激活函数。

ReLU为非饱和函数，论文中验证其效果在较深的网络超过了SIgmoid，成功解决了SIgmoid在网络较深时的梯度弥散问题。

（2）Dropout避免模型过拟合

在训练时使用Dropout随机忽略一部分神经元，以避免模型过拟合。在alexnet的最后几个全连接层中使用了Dropout。

（3）重叠的最大池化

之前的CNN中普遍使用平均池化，而Alexnet全部使用最大池化，避免平均池化的模糊化效果。并且，池化的步长小于核尺寸，这样使得池化层的输出之间会有重叠和覆盖，提升了特征的丰富性。

（4）提出LRN层

提出LRN层，对局部神经元的活动创建竞争机制，使得响应较大的值变得相对更大，并抑制其他反馈较小的神经元，增强了模型的泛化能力。

（5）GPU加速

（6）数据增强

随机从256*256的原始图像中截取224*224大小的区域（以及水平翻转的镜像），相当于增强了（256-224）*（256-224）*2=2048倍的数据量。使用了数据增强后，减轻过拟合，提升泛化能力。避免因为原始数据量的大小使得参数众多的CNN陷入过拟合中。

四、AlexNet的搭建

利用tensorflow实现ALexNet，环境为：win10+anaconda+python3+CPU(本人仅利用CPU，未使用GPU加速，所以最终模型训练速度较慢)。

利用tensorboard可视化ALexNet结构为&#

最低0.47元/天解锁文章

博客等级

码龄12年

108
原创

1034
点赞

4962
收藏

859
粉丝

关注

私信

热门文章

分类专栏

最新评论

【机器学习】支持向量机SVM及实例应用
bo_hai: 楼主，你咋设置成vip可见呢？！你这水平，应该不差钱呀！
【翻译经典】Rapid Object Detection using aBoosted Cascade of Simple Features（人脸检测经典论文）
尧哥235: cvpr
三、生成RPM包
CSDN-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
三、生成RPM包
大姨妈V: ###### 1.生成可执行文件、库文件 ######### cmake_minimum_required(VERSION 3.15) project(compute) set(target zls_bin) set(target2 libcompute.so) # 依赖的头文件 include_directories(${PROJECT_SOURCE_DIR}/include) file(GLOB include_file "${PROJECT_SOURCE_DIR}/include/*.h") # 文件搜索 file(GLOB SRC "${PROJECT_SOURCE_DIR}/src/*.c") # 设置生成库文件的路径(静态库\动态库都可行) set(LIBRARY_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/lib) # 设置生成可执行文件的路径 set(EXECUTABLE_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/bin) set(CMAKE_VERBOSE_MAKEFILE ON) MESSAGE("PROJECT_NAME:${PROJECT_NAME}") MESSAGE("SRC:${SRC}") MESSAGE("LIBRARY_OUTPUT_PATH:${LIBRARY_OUTPUT_PATH}") MESSAGE("include_file:${include_file}") # 生成静态库文件 #add_library(${PROJECT_NAME} STATIC ${SRC}) # 生成动态库文件 add_library(${PROJECT_NAME} SHARED ${SRC}) # 生成可执行文件（方式三：链接动态库文件） ## 包含动态库路径 link_directories(${PROJECT_SOURCE_DIR}/lib) ## 生成可执行文件 add_executable(${target} main.c) ## 链接动态库文件(target 依赖动态库compute) target_link_libraries(${target} ${PROJECT_NAME})
三、生成RPM包
大姨妈V: # 将依赖的头文件安装到include目录 install(DIRECTORY ${PROJECT_SOURCE_DIR}/include DESTINATION include COMPONENT BComponent) #install(FILES ${include_file} DESTINATION include COMPONENT BComponent) include(CPack) # 添加一个名为 AComponent 的 component cpack_add_component(AComponent DISPLAY_NAME "A program" DESCRIPTION "The program for test" GROUP Aprogram) # 添加一个名为 BComponent 的 component cpack_add_component(BComponent DISPLAY_NAME "B program" DESCRIPTION "The program for test" GROUP Bprogram) # 添加一个名为 Aprogram 的 group, 这个名字会作为 rpm 包名字的一部分 cpack_add_component_group(Aprogram) # 添加一个名为 Bprogram 的 group cpack_add_component_group(Bprogram)

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。