神经网络简单概述

正在进步的小李

已于 2023-07-11 11:09:42 修改

阅读量46

点赞数

分类专栏：神经网络基础知识文章标签：神经网络人工智能深度学习

于 2023-07-11 11:08:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72955351/article/details/131648024

版权

神经网络基础知识专栏收录该内容

2 篇文章 0 订阅

订阅专栏

神经网络基础

人工神经元

神经网络的出现是从人工神经元初始化过来的

生物学神经元

在这里插入图片描述

人工神经元

在这里插入图片描述

多层感知机

但是上述方法存在一个问题，即无法区分异或。可以在坐标系中将4种可能标注出来，发现异或这个图无法用一条线去区分

面临这个问题，因此出现了多层感知机

激活函数

但是通过增加隐藏层能够改善。但是通过数学公式推到可知，只是单纯的堆叠，最后都是变成一个网络。这个时候出现了激活函数。添加激活函数后就能逼近任何函数（万能逼近定理）

激活函数主要有：sigmoid函数、tanh函数、ReLU函数

其中：
sigmoid函数和tanh函数是饱和函数，当取值很大的时候如何出现梯度消失，无法继续更新参数

相比之下ReLU函数就比较好，同时ReLU函数在训练的时候速度也更加快（AlexNet网络已经证明）

反向传播

用于更新参数，使网络更加接近标签，其中反向传播就是微积分的链式求导法则。其中梯度的传播也是在求梯度中体现的。在求某一层的梯度时，就是之前的梯度+ 现在这个变量的梯度

梯度下降

梯度的反向传播求取每个变量的梯度，再进行更新参数，更新参数的时候，采用的是：梯度下降。即：权值沿梯度的负方向更新（梯度的正方向是函数上升最快的地方），使得函数下降。

学习率
在更新的时候，还应该注意梯度的学习率，一个好的学习率能够使得网络能够更好的收敛

损失函数

进行反向传播本质就是让损失函数下降。损失函数是衡量模型输出和真实标签的差异

其中应该注意：损失函数（单样本）、代价函数（整个数据集）、目标函数：损失函数+正则项（控制模型复杂度）

常见两种损失函数

MSE（均方误差）输出于标签之差的平方均值。常在回归任务中使用
CE（交叉熵）交叉熵来自信息论。用于衡量两个分布的差异。常在分类任务中使用，与softmax一起使用

权值初始化

训练前对权值参数赋值，良好的权值初始化有利于模型训练

简单但错误的方法：初始化全部为0

随机初始化方法：高斯分布随机初始化，从高斯分布中随机采样，对权重赋值，比如：N~（0，0.01）

其中方差的选取格外重要，权重过大，会使得x落入sigmoid函数的饱和区

因此有：自适应标准差—自适应方法随机分布中的标准差

Xavier初始化 / Kaiming初始化（MSRA）

正则化

减轻过拟合，减少方差的策略

误差= 偏差+ 方差 +噪声

偏差：度量学习算法的期望预测与真实结果的偏差程度
方差：同样大小的训练集的变动所导致的学习性能的变化
噪声：表达在当前任务上任务学习算法所能达到的期望泛化误差的下界

可以采用的方法有：L1正则化、L2正则化

在这里插入图片描述
其中：

L1正则化项：在相切的位置此时最小。起到权值稀疏的效果
L2正则化项：在相切的位置此时最小。起到权值衰减

也可以采用dropout进行正则化，即：随机初始化

需要注意：训练和测试两个阶段的数据尺度变化，测试时，神经元输出值需要乘以p

正在进步的小李

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

正在进步的小李 CSDN认证博客专家 CSDN认证企业博客

码龄2年

20: 原创

142万+: 周排名

112万+: 总排名

1899: 访问

: 等级

221: 积分

1: 粉丝

0: 获赞

13: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

语法学习（一）
CSDN-Ada助手: 恭喜您写了第三篇博客！标题为“语法学习（一）”。您的坚持和创作热情令人钦佩。在这篇博客中，您似乎开始探索语法学习的奥秘，这是一个非常重要的主题，对于提高语言表达能力至关重要。接下来，我建议您可以继续深入探讨语法学习的其他方面，例如不同语法规则的应用场景、常见语法错误的纠正方法等。谦虚地说，我相信您对语法学习有更多独到见解。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
VGG网络
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题为“VGG网络”，看来您对深度学习的研究和实践非常扎实。在这篇博客中，您对VGG网络进行了详尽的介绍，为读者提供了宝贵的知识。不过，如果我可以提供一些建议的话，或许您可以在下一篇博客中探讨一下VGG网络在图像分类任务中的应用案例，这将进一步丰富您的内容，使读者更好地理解和应用VGG网络。期待您未来更多的博客创作，谢谢您的分享！
GooLeNet V1 网络学习
CSDN-Ada助手: 恭喜您撰写了第10篇博客！标题中的“GooLeNet网络学习”引起了我的兴趣。您对网络学习的深入研究令人敬佩。在下一步的创作中，或许您可以考虑加入一些实例或案例，以便更好地说明GooLeNet在网络学习中的应用。我相信您的谦虚态度将会让您不断进步，期待您未来更多的精彩博文！
GoogleNet V2
CSDN-Ada助手: 恭喜你撰写了第11篇博客，标题为“GoogleNet V2”！你的持续创作精神令人钦佩。在这篇博客中，你提到了GoogleNet的第二版，这无疑是一个引人注目的主题。下一步，我建议你可以进一步探索GoogleNet V2的创新之处，比如其在图像识别领域的应用以及与之前版本的对比。同时，也可以讨论一下GoogleNet V2相对于其他深度学习模型的优势和不足之处。期待你在未来的创作中继续保持谦虚态度，为读者带来更多有价值的内容！
GoogLeNet V3
CSDN-Ada助手: 恭喜您撰写了第12篇博客，题为“GoogLeNet V3”。您对于持续创作的热情令人钦佩，这表明您对该主题的深入理解和扎实的知识储备。在接下来的创作中，我建议您考虑探讨一些与GoogLeNet V3相关的实践案例或者对该模型的进一步改进。期待在您的博客中继续学习到更多有价值的知识。谦虚的态度将使您的博客更具魅力，同时也会吸引更多读者的关注。加油！

大家在看

VitePress是干什么的，怎么使用？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。