神经网络与深度学习（三）

layB

已于 2023-05-31 15:32:35 修改

阅读量222

点赞数

分类专栏：学习报告文章标签：深度学习神经网络人工智能

于 2022-12-10 17:43:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/darlingb/article/details/128264990

版权

学习报告专栏收录该内容

24 篇文章 2 订阅

订阅专栏

四、前馈神经网络

4.1神经元

在这里插入图片描述
可以看成一个简单的线性模型

不同神经元区别在于激活函数f
在这里插入图片描述
激活函数不一定要单调递增
举例：

S型函数

非零中心化解决办法：1.normalization（归一化） 2.σ(x)+b（加偏置）

斜坡函数：
在这里插入图片描述
x<0时y全为0（死亡ReLU问题）
解决办法：近似零中心化的非线性函数

使函数介于线性和ReLu之间

在这里插入图片描述

4.2神经网络

三个要素：激活函数、网络拓扑、学习算法
在这里插入图片描述

4.3前馈神经网络

在这里插入图片描述
三层网络（输入层一般不算层，记为第0层）

应用：

4.4反向传播算法

矩阵微积分写法：
在这里插入图片描述
矩阵微积分中的链式法则：

先忽略正则项

如若计算一个参数的偏导数，首先计算出损失函数在最后一层的偏导数，即最后一层的σ(l)，然后通过迭代公式一层一层往前传，得到每一层的误差项，再乘上对应参数的导数，就得到损失函数对应每一层的导数
在这里插入图片描述

4.5计算图与自动微分

更加高效的微分方法
在这里插入图片描述

两层的神经网络
第一层Dense（全连接层）： 输出100维输出64维，用relu激活函数
第二层Dense（输出层）： 输入64维输出10维，用Softmax激活函数
损失函数用交叉熵
优化用sgd
metrics 用准确率
model.fit 用随机梯度下降开始训练
nb_epoch: 当一个完整的数据集通过了神经网络一次并且返回了一次，这个过程称为一次epoch。（也就是说，所有训练样本在神经网络中都进行了一次正向传播和一次反向传播）再通俗一点，一个Epoch就是将所有训练样本训练一次的过程。
batch_size： 一次训练所选取的样本数。

4.6优化问题

eg:两层的神经网络

在这里插入图片描述
区分全局优化和局部优化比较困难

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络与深度学习（三）

神经网络与深度学习（三）
复制链接

扫一扫

专栏目录

layB CSDN认证博客专家 CSDN认证企业博客

码龄5年

38: 原创

10万+: 周排名

28万+: 总排名

3万+: 访问

: 等级

412: 积分

27: 粉丝

25: 获赞

18: 评论

252: 收藏

私信

关注

热门文章

分类专栏

最新评论

YOLOV1神经网络结构
源动随风: 请问第一层的padding是多少
YOLOV1神经网络结构
wazzaho: 请问一下第二层他是怎么看出来有256个卷积核的呀
YOLOV1神经网络结构
wazzaho: 我最近也在看这个有点懵逼感觉第一层和后面几层不太一样
YOLOV1神经网络结构
layB: 我的理解是他这第一层其实是扩展了，每个卷积核和三个通道相乘，但是不叠加，所以是3*64=192，有点不一样的；后面是正常的卷积操作，几个卷积核输出就是几维，每个卷积核和前面的通道卷积之后叠加输出一层，所以输出层数等于卷积核层数。看这个图也比较懵逼哈哈哈，这是我的想法，如果你弄清楚了可以和我说说
YOLOV1神经网络结构
qq_43988220: 但是他那个第一层和第二层的卷积方式不一样吗？第二层我能理解，就卷积核决定了输出的深度大小，但是第一层里面的输出深度是由输入的深度和卷积核的深度共同决定的?我看网上大部分都是说，卷积核的深度就是输出的深度。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。