CNN卷积神经网络

屿anglersking＇s THU

已于 2022-12-22 01:24:59 修改

阅读量706

点赞数

分类专栏：神经网络文章标签： cnn 深度学习神经网络

于 2022-12-20 16:00:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44691051/article/details/128385856

版权

神经网络专栏收录该内容

5 篇文章 1 订阅

订阅专栏

CNN卷积神经网络

前言
一、相关概念
二、经典网络
三、实操一般步骤结构
- 举例
- 代码链接

前言

为什么用卷积神经网络

全连接神经网络问题

参数过多
过拟合
需要更多数据
收敛到较差的局部极值

卷积神经网络

局部连接
参数共享

提示：以下是本篇文章正文内容，下面案例可供参考

一、相关概念

卷积

在这里插入图片描述

彩色图像卷积

在这里插入图片描述

池化

最大池化
平均池化

padding

每次卷积图像都会缩小，层数越多，缩小的越多。
边沿的像素会被忽略

padding大小
n+2p-f+1=n
padding 类型
valid
same
如果有步长则
（n-f)/S+1+2p=n

Dropout正则化

目的
减少过拟合
方法
在一次训练时的迭代中，对每一层中的神经元（总数为N）以概率P随机剔除，用余下的（1-P）×N个神经元所构成的网络来训练本次迭代中的数据。
一般来说对于CNN，Dropout仅在池化层后使用

局部归一化

在这里插入图片描述

LRN ( Local Response Normalization) 局部响应归一化

二、经典网络

AlexNet

作者：
– Alex Krizhevsky
2012 ILSVRC（ImageNet Large Scale Visual Recognition Challenge）竞赛的冠军网络
– 分类准确率从传统的74%提升到84%
– top-5错误率16.4%
亮点：
首次使用了GPU进行网络加速训练
– 使用了ReLU 激活函数，而不是传统的sigmoid和tanh
– 在全连接层前两层使用了Dropout，减少过拟合
– 局部归一化（Local Response Normalization，简称LRN）

在这里插入图片描述

VGGNet介绍

VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络
成绩：
ILSVRC 2014年比赛的亚军和定位项目的冠军
将 Top-5错误率降到7.3%
特点：
– 小卷积核和多卷积子层
— 33
– 小池化核
— 22
weight初始赋值
小型的VGG :正态分布
大型的VGG: 从已经训练好的小型VGG中拷贝过去
input图像处理
[256;512]

GoogLeNet

谷歌团队创建
成绩：
2014 ILSVRC2014比赛中取得冠军
22层神经网络达到top-5错误率6.7%
亮点
所用模型参数不足AlexNet（2012年冠军）的1/12
Inception结构
丢弃全连接层，使用平均池化层（大大的减少了模型参数）
添加了两个辅助分类器帮助训练
使用1X1卷积核进行降维以及映射

在这里插入图片描述

ResNet介绍

ResNet（Residual Neural Network）由微软研究院的Kaiming He等四名华人提出
成绩：
2015 ILSVRC2015比赛中取得冠军
152层神经网络top5上的错误率为3.57%
同时参数量比VGGNet低

发现层数越多反而效果不i好

原因：梯度消失
在这里插入图片描述

resnet解决方案

在这里插入图片描述

结果

在这里插入图片描述

三、实操一般步骤结构

在这里插入图片描述

举例

在这里插入图片描述

代码链接

https://github.com/anglersking/simple_deep_learning/tree/master/CNN

屿anglersking＇s THU

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CNN卷积神经网络

卷积神经网络干货
复制链接

扫一扫

专栏目录

屿anglersking＇s THU CSDN认证博客专家 CSDN认证企业博客

码龄5年

91: 原创

30万+: 周排名

208万+: 总排名

7万+: 访问

: 等级

1105: 积分

138: 粉丝

45: 获赞

29: 评论

344: 收藏

私信

关注

热门文章

分类专栏

最新评论

三天搞定射频识别技术（三）3.1 NFC概述
我真想进步: 其实RFID的也可以实现信息的互换吧，阅读器可以向电子标签发送或者接受数据。
STM32 IIC通信干货！理论+实例
ccbzq1223: 老大，能把代码发全吗，对于大佬没必要，对于小白来说这个很重要。
机器学习1一元线性回归
屿anglersking＇s THU: 下面是求导的步骤：成本函数定义: J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(θ0,θ1)=2m1∑i=1m(hθ(x(i))−y(i))2 假设函数: hθ(x(i))=θ0+θ1x(i)hθ(x(i))=θ0+θ1x(i) 对 θ1θ1 求偏导: 我们首先将假设函数代入成本函数，然后对参数 θ1θ1 求偏导数。 ∂∂θ1J(θ0,θ1)=∂∂θ1(12m∑i=1m(θ0+θ1x(i)−y(i))2)∂θ1∂J(θ0,θ1)=∂θ1∂(2m1∑i=1m(θ0+θ1x(i)−y(i))2) 应用链式法则: 对内部的平方项求偏导数，我们会应用链式法则，即首先对内部函数 u=θ0+θ1x(i)−y(i)u=θ0+θ1x(i)−y(i) 求偏导，然后乘以对 uu 的偏导数。这意味着我们首先对 (θ0+θ1x(i)−y(i))(θ0+θ1x(i)−y(i)) 求导数，然后乘以 22，最后乘以 x(i)x(i) （内部函数的导数）。 ∂∂θ1J(θ0,θ1)=12m∑i=1m2(θ0+θ1x(i)−y(i))∂∂θ1(θ0+θ1x(i)−y(i))∂θ1∂J(θ0,θ1)=2m1∑i=1m2(θ0+θ1x(i)−y(i))∂θ1∂(θ0+θ1x(i)−y(i)) 化简导数: 因为 θ0θ0 和 y(i)y(i) 是常数，它们的导数为零。我们只剩下 θ1x(i)θ1x(i) 的导数，等于 x(i)x(i)。 ∂∂θ1J(θ0,θ1)=12m∑i=1m2(θ0+θ1x(i)−y(i))⋅x(i)∂θ1∂J(θ0,θ1)=2m1∑i=1m2(θ0+θ1x(i)−y(i))⋅x(i) 进一步化简: 最后，我们可以去掉常数 2 和 12m2m1 相消，得到最终的偏导数表达式。 ∂∂θ1J(θ0,θ1)=1m∑i=1m(θ0+θ1x(i)−y(i))⋅x(i)∂θ1∂J(θ0,θ1)=m1∑i=1m(θ0+θ1x(i)−y(i))⋅x(i) 这就是为什么对于参数 θ1θ1 的偏导数中会乘上 x(i)x(
1.1docker介绍安装
屿anglersking＇s THU: sudo usermod -a -G docker $USER
树莓派ROS stm32 slam Freertos VFH+A*避障路径规划-智能平衡计划（四）
傲酱: 您好，想问一下，每个任务结束后的延时是为了任务的周期执行，以及让出CPU吗？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。