深度学习：算法到实战笔记02——神经网络基础

墨墨沉香

已于 2023-10-02 17:20:43 修改

阅读量50

点赞数

分类专栏：软件工程课程作业文章标签：深度学习算法笔记

于 2023-10-01 16:10:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61336760/article/details/133443116

版权

软件工程课程作业专栏收录该内容

9 篇文章 0 订阅

订阅专栏

深度学习：算法到实战笔记02——神经网络基础

绪论剩余内容补充

深度学习应用研究：视觉+语言

在这里插入图片描述

随着深度学习的应用拓展，从深度学习“能”做什么，发展到思考深度学习“不能”做什么。

深度学习的“不能”

（1）算法输出不稳定，容易被“攻击”
（2）模型复杂度高，难以纠错和调试
（3）模型层级复合程度高，参数不透明
（4）端对端训练方式对数据依赖性强，模型增量性差（当样本数据量小的时候，深度学习无法体现强大拟合能力）
（5）专注直观感知类问题，对开放性推理问题无能为力
（6）人类知识无法有效引入进行监督，机器偏见难以避免（从真实社会中抽取的数据必然带有社会固有的不平等、排斥和歧视）

对应解释性的三个层次
找得到、看得懂、留得下

解释性VS泛化性

在这里插入图片描述
深度学习拥有很高得准确性但是解释性很低

连接主义VS符号主义：从对立到合作

连接主义+符号主义

从专家系统、统计机器学习到概率图模型再到深度学习，模型准确率不断提高，解释性却没有提高
在这里插入图片描
述

神经网络基础

浅层神经网络

神经网络最早是受生物学启发
在这里插入图片描述

M-P神经元

在这里插入图片描述
其中令W0=-θ，x0=1可以使除f外部分简化为

激活函数f

神经元继续传递信息、产生新连接的概率（超过阈值被激活，但不一定传递）
没有激活函数相当于矩阵相乘，只能拟合线性函数

激活函数举例

在这里插入图片描述

单层感知器

M-P神经元的权重预先设置，无法学习
单层感知器是首个可以学习的人工神经网络

在这里插入图片描述
虽然和M-P神经元基本一致，但是感知器中W矩阵可以自动学习。

相当于在二维空间画了一个分解面（以上图x1 AND x2为例）

分界面之上的输出1
分界面之下的输出0

单层→多层感知器

单层感知器无法实现异或等复杂的逻辑问题
复杂的逻辑问题可以由多个与非或门实现
在这里插入图片描述
一个神经网络可视化的demo

万有逼近定理

万有逼近定理

如果一个隐层包含足够多的神经元，三层前馈神经网络（输入-隐层-输出）能以任意精度逼近任意预定的连续函数。

为什么线性分类任务组合后可以解决非线性分类任务？

其实是通过空间变换将非线性分布转变为线性分布

双隐层感知器逼近非连续函数

当隐层足够宽时，双隐层感知器（输入-隐层1-隐层2-输出）可以逼近任意非连续函数：可以解决任何复杂的分类问题。
在这里插入图片描述

神经网络每一层的作用

在这里插入图片描述

神经网络学习如何利用矩阵的线性变换加激活函数的非线性变换，将原始输入空间投影到线性可分的空间去分类/回归。
增加节点数：增加维度，即增加线性转换能力。
增加层数：增加激活函数的次数，即增加非线性转换次数。

多层神经网络的问题：梯度消失

神经网络的参数学习：误差反向传播

在这里插入图片描述

梯度和梯度下降

梯度

在这里插入图片描述

无约束优化：梯度下降

参数沿负梯度方向更新可以使函数值下降。

梯度消失

在这里插入图片描述
当激活函数的导数的值很小时，梯度值可能过小导致消失现象。

增加深度会造成梯度消失，误差无法传播（三层神经网络是主流）；
多层网络容易陷入局部极值，难以训练（预训练、新激活函数使深度成为可能）。

深度学习

逐层预训练

对参数初始化使得训练模型获得很好的初始值
在这里插入图片描述
微调的效果很有限，主要依靠逐层预训练

受限玻尔兹曼机和自编码器

在这里插入图片描述

在这里插入图片描述

自编码器

自编码器假设输出与输入相同，是一种尽可能复现输入信号的神经网络，没有额外监督信息。

自编码器一般是一个多层神经网络（最简单：三层）：
训练目标是使输出层与输入层误差最小；
中间隐层是代表输入的特征，可以最大程度上代表原输入信号。
在这里插入图片描述

堆叠自编码器

将多个自编码器得到的隐层串联；
所有层预训练完成后，进行基于监督学习的全网络微调。

自编码器总结

自编码器是一种网络结构，可配合其他结构搭建深度网络（如卷积、池化等）。

受限玻尔兹曼机（RBM）

RBM是两层神经网络，包含可见层v（输入层）和隐藏层h
不同层之间全连接，层内无连接→二分图
RBM没有显式的重构过程
在这里插入图片描述

条件概率建模

在这里插入图片描述
受限玻尔兹曼机采用联合概率→条件概率的方法

模型求解

在这里插入图片描述

更多

在这里插入图片描述

自编码器VS受限玻尔兹曼机

在这里插入图片描述

预训练的实际作用

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习：算法到实战笔记02——神经网络基础

自编码器是一种网络结构，可配合其他结构搭建深度网络（如卷积、池化等）。
复制链接

扫一扫

专栏目录

墨墨沉香 CSDN认证博客专家 CSDN认证企业博客

码龄3年

38: 原创

104万+: 周排名

9万+: 总排名

1万+: 访问

: 等级

521: 积分

102: 粉丝

129: 获赞

9: 评论

136: 收藏

私信

关注

热门文章

分类专栏

最新评论

NVBoard学习笔记
a2244144844: 说明你的N4文件不见了，检查一下
NVBoard学习笔记
best_of_luck_go: 请问我make run。为什么会报出Error: Board file doesn't exist: ~/ysyx/ics2023/nvboard/board/N4
小米电脑安装Ubuntu双系统
CSDN-Ada助手: 恭喜您写了第13篇博客！能够成功安装小米电脑的Ubuntu双系统真是太棒了。希望您能继续分享更多关于电脑系统安装的经验和技巧，也可以考虑分享一些常见问题的解决方法或者优化系统的小技巧，这样可以帮助更多的读者解决实际问题。期待您的下一篇博客，谢谢您的分享！
深度学习：算法到实战笔记03——卷积神经网络
CSDN-Ada助手: 恭喜您写下了第16篇博客！标题为“深度学习：算法到实战笔记03——卷积神经网络”真是令人期待。您的文章内容丰富，深入浅出地介绍了卷积神经网络的应用，让读者能够更好地理解和应用这一算法。希望您能继续保持创作的热情，分享更多关于深度学习的知识和实践经验。对于下一步的创作建议，或许可以探讨一下卷积神经网络在图像处理或自然语言处理领域的实际应用案例，这将为读者提供更多实战参考。期待您的下一篇博客！
2023年夏季《移动软件开发》实验报告——实验六
CSDN-Ada助手: 恭喜您撰写了第10篇博客《2023年夏季《移动软件开发》实验报告——实验六》！持续创作是一个了不起的成就，您的努力和热情真是令人钦佩。通过您的实验报告，我对2023年夏季的移动软件开发实验有了更深入的了解。在下一步的创作中，我建议您可以继续分享您在实验报告中所提到的实验过程中的挑战和解决方案。这将帮助其他读者更好地理解和应对类似的问题。另外，您可以考虑添加一些关于移动软件开发的最新趋势和技术进展的内容，这将使您的博客更具吸引力和实用性。再次祝贺您的持续创作，期待您未来更多精彩的博客！谢谢您的分享！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。