【复旦邱锡鹏教授《神经网络与深度学习公开课》笔记】深度学习

Don＇t move

已于 2024-05-10 01:56:47 修改

阅读量741

点赞数 5

分类专栏：邱锡鹏-神经网络与深度学习文章标签：人工智能

于 2024-05-10 01:53:48 首次发布

本文链接：https://blog.csdn.net/qq_48520962/article/details/138639367

版权

邱锡鹏-神经网络与深度学习专栏收录该内容

22 篇文章 4 订阅

订阅专栏

好的表示学习策略必须具备一定的深度

深度（Depth）
神经网络层级个数，层数越多则越深

深度学习=表示学习+浅层（决策/预测）学习

在这里插入图片描述

这种从原始数据直接产生预测结果，中间特征提取部分不需要人工干预的形式叫做端到端（End-to-End）。大多数的深度学习模型都是端到端模型。

深度学习的难点——贡献度分配问题
深度学习采用的模型一般比较复杂，指样本的原始输入到输出目标之间的数据流经过多个线性或非线性的组件（component）。因为每个组件都会对信息进行加工，并进而影响后续的组件，所以当我们最后得到输出结果时，我们并不清楚其中每个组件的贡献是多少。这个问题叫作贡献度分配问题（Credit Assignment Problem，CAP）¹。
解决贡献度分配问题的一个好方法就是神经网络。

深度学习的数学描述

在这里插入图片描述
$x$ 是参数，在浅层学习中，需要人为通过进行特征工程来获得这个代表高层语义的参数。通过不断的嵌套函数，使函数嵌套的更”深“，来实现使用计算机来提取特征，用上图深度学习一行解释， $f^1$ — $f^4$ 是特征提取函数，通过提取四层函数来不断提取出特征，最后通过 $f^5$ 分类器函数对特征进行分类。

$f^n(x)$ 为非线性函数的原因
对于线性函数来说，嵌套的结果仍是线性函数，这样的嵌套没有意义。比如说：
$f^1(x)=a_1x+b_1，f^2(x)=a_2x+b_2$
$\begin{aligned} f(x)&=f^2(f^1(x))\\ &=a_2(a_1x+b_1)+b_2\\ &=a_2a_1x+a_2b_1+b_2\\ &=Ax+B \end{aligned}$
变量与符号无关，可近似认为 $Ax+b=a_1x+b_1$ ，相当于没有嵌套，因此说线性函数的嵌套是没有意义的。

邱希鹏《神经网络与深度学习》笔记第一部分机器学习基础第1章绪论 - 知乎 (zhihu.com) ↩︎

Don＇t move

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
【复旦邱锡鹏教授《神经网络与深度学习公开课》笔记】深度学习

好的表示学习策略必须具备一定的深度神经网络层级个数，层数越多则越深深度学习=表示学习+浅层（决策/预测）学习这种从原始数据直接产生预测结果，中间特征提取部分不需要人工干预的形式叫做。大多数的深度学习模型都是端到端模型。深度学习的难点——深度学习采用的模型一般比较复杂，指样本的原始输入到输出目标之间的数据流经过多个线性或非线性的因为每个组件都会对信息进行加工，并进而影响后续的组件，所以当我们最后得到输出结果时，我们并不清楚其中每个组件的贡献是多少。这个问题叫作。
复制链接

扫一扫