深度学习学习笔记

最新推荐文章于 2022-02-28 11:43:12 发布

略略略06

最新推荐文章于 2022-02-28 11:43:12 发布

阅读量323

点赞数

文章标签：机器学习算法深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44916258/article/details/121481029

版权

3前馈神经网络

神经网络是最早作为一种连接主义为主的模型。

3.1神经元模型

3.1.1神经元（M-P）

在M-P模型中，神经元接受其他n个神经元的输入信号(0或1)，这些输入信号经过权重加权并求和，将求和结果与阈值(threshold) θ 比较，然后经过激活函数处理，得到神经元的输出。

$y=f(\sum_{i=1}^{n}\omega _{ij}x_{i}-\theta )$

图3-1典型的神经元结构

3.1.2网络结构

人工神经网络由神经元模型构成，这种由许多神经元组成的信息处理网络具有并行分布结构。

4.3

图3-2几种神经网络网络结构

3.2感知器

3.2.1单层感知机

1958 年，罗森布拉特( Roseblatt )提出了感知器，与 M-P 模型需要人为确定参数不同，感知器能够通过训练自动确定参数。训练方式为有监督学习，即需要设定训练样本和期望输出，然后调整实际输出和期望输出之差的方式(误差修正学习)。

$\omega _{i}\leftarrow \omega _{i}+\alpha (r-y)x$

$\theta \leftarrow \theta -\alpha (r-y)$

其中，α 是学习率，r和y分别是期望输出和实际输出。

感知器模型的训练过程：

4.5

3.2.2多层感知机

单层感知器只能解决线性可分问题，而不能解决线性不可分问题；为了解决线性不可分问题，我们需要使用多层感知器。

4.7

多层感知器指的是由多层结构的感知器递阶组成的输入值向前传播的网络，也被称为前馈网络或正向传播网络。

3.3BP算法

多层感知器的训练使用误差反向传播算法(Error Back Propagation)，即BP算法。BP算法最早有沃博斯于1974年提出，鲁梅尔哈特等人进一步发展了该理论。

3.3.1BP算法的基本过程

BP算法就是通过比较实际输出和期望输出得到误差信号，把误差信号从输出层逐层向前传播得到各层的误差信号，再通过调整各层的连接权重以减小误差。权重的调整主要使用梯度下降法：

$\Delta \omega =-\alpha \frac{\partial E}{\partial \omega }$

3.3.2激活函数

通过误差反向传播算法调整多层感知器的连接权重时，一个瓶颈问题就是激活函数：

3.3.3BP算法实例

以包含一个中间层和一个输出单元 y 的多层感知器为例： $\omega _{1ij}$ 表示输入层与中间层之间的连接权重， $\omega _{2ij}$ 表示中间层与输出层之间的连接权重， i 表示输入层单元，j 表示中间层单元。

4.11

3.4优化问题

3.4.1难点

（1）参数过多，影响训练

（2）非凸优化问题：即存在局部最优而非全局最优解，影响迭代

（3）梯度消失问题，下层参数比较难调

（4）参数解释起来比较困难

3.4.2需求

（1）计算资源要大

（2）数据要多

（3）算法效率要好，即收敛要快

3.4.3非凸优化问题

神经网络的优化问题是一个非凸优化问题．以一个最简单的1-1-1结构的两层神经网络为例，

$y=\sigma( \omega_{2}\sigma (\omega _{1}x))$

其中𝑤1 和𝑤2 为网络参数，𝜎(⋅)为Logistic函数．

给定一个输入样本 (1, 1)，分别使用两种损失函数，第一种损失函数为平方误差损失：ℒ(𝑤1 , 𝑤2 ) = (1 − 𝑦)2，第二种损失函数为交叉熵损失 ℒ(𝑤1 , 𝑤2 ) = log 𝑦．当 𝑥 = 1, 𝑦 = 1 时，其平方误差和交叉熵损失函数分别为：ℒ(𝑤1 , 𝑤2 ) = (1 − 𝑦)2 和ℒ(𝑤1 , 𝑤2 ) = log 𝑦．损失函数与参数𝑤1 和𝑤2 的关系如图所示，可以看出两种损失函数都是关于参数的非凸函数．

3.4.4梯度消失问题

由于 Sigmoid 型函数的饱和性，饱和区的导数更是接近于0．这样，误差经过每一层传递都会不断衰减．当网络层数很深时，梯度就会不停衰减，甚至消失，使得整个网络很难训练．这就是所谓的梯度消失问题（Vanishing Gradient Problem），也称为梯度弥散问题。

在深度神经网络中，减轻梯度消失问题的方法有很多种．一种简单有效的方式是使用导数比较大的激活函数，比如ReLU等

参考资料

神经网络与深度学习

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习学习笔记

3前馈神经网络神经网络是最早作为一种连接主义为主的模型。3.1神经元模型3.1.1神经元（M-P）在M-P模型中，神经元接受其他n个神经元的输入信号(0或1)，这些输入信号经过权重加权并求和，将求和结果与阈值(threshold)θ比较，然后经过激活函数处理，得到神经元的输出。图3-1典型的神经元结构3.1.2网络结构人工神经网络由神经元模型构成，这种由许多神经元组成的信息处理网络具有并行分布结构。图3-2几种神经网络网络结构3.2感知器3.2.1单...
复制链接

扫一扫

略略略06 CSDN认证博客专家 CSDN认证企业博客

码龄5年

15: 原创

79万+: 周排名

225万+: 总排名

1万+: 访问

: 等级

157: 积分

3: 粉丝

6: 获赞

2: 评论

39: 收藏

私信

关注

热门文章

分类专栏

NeRF论文学习 2篇

最新评论

个人学习记录
CSDN-Ada助手: 恭喜您在博客世界中迈出了第16步！标题“个人学习记录”让我猜测您将与我们分享学习之旅中的点滴成果。我真诚地祝贺您的持续创作，这种坚持和努力值得赞赏。在以学习为主题的博客中，您可以进一步探索一些学习方法和技巧，或者分享一些您认为对个人学习过程有益的资源和工具。您的经验和见解将对那些渴望提升自己的读者产生重要影响。在未来的创作中，或许您可以考虑扩大内容范围，包括探讨学习心得、职业发展或者个人成长等方面的主题。这样一来，读者们将更多地从您的经历中获得启发和指导。再次恭喜您，期待您未来更多的精彩创作！
泛化nerf系列：pixelNeRF 一种基于NeRF的多视角三维重建网络
a1392021: “将该特征与空间坐标（包含x xx和d dd）一起传递到NeRF网络f ff中”，对应于代码的哪里？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。