《深度学习》笔记（二）

最新推荐文章于 2024-05-20 11:05:55 发布

仿生程序员会梦见电子羊吗

最新推荐文章于 2024-05-20 11:05:55 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习文章标签：深度学习神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Algernon98/article/details/123503984

版权

机器学习专栏收录该内容

25 篇文章 2 订阅

订阅专栏

第二部分深度网络：现代实践

深度前馈网络

深度前馈网络，也叫做前馈神经网络或者多层感知机，是典型的深度学习模型。

这种模型被称为前向的，是因为信息流过 $x$ 的函数，流经用于定义 $f$ 的中间计算过程，最终到达输出 $y$ 。在模型的输出和模型本身之间没有反馈连接。当前馈神经网络被扩展成包含反馈连接时，它们被称为循环神经网络。

前馈神经网络被称作网络是因为它们通常用不同函数复合在一起来表示。
该模型与一个有向无环图相关联，而图描述了函数是如何复合在一起的。

例如，我们有三个函数 $f^{(1)}$ , $f^{(2)}$ , $f^{(3)}$ 连接在一个链上以形成 $f(x)=f^{(3)}(f^{(2)}(f^{(1)}(x)))$ 。这些链式结构是神经网络中最常用的结构。
在这种情况下， $f^{(1)}$ 被称为网络的第一层， $f^{(2)}$ 被称为第二层，以此类推。
链的全长称为模型的深度。前馈网络的最后一层被称为 输出层。

基于梯度的学习

混合密度网络
反向传播

深度学习中的正则化

参数范数惩罚

权重衰减

作为约束的范数惩罚

数据集增强

噪声鲁棒性
半监督学习
多任务学习

深度模型中的优化

机器学习算法的目标是降低期望泛化误差。

批量算法和小批量算法

机器学习算法和一般优化算法不同的一点是，机器学习算法的目标函数通常可以分解为训练样本上的求和。机器学习中的优化算法在计算参数的每一次更新时通常仅使用整个代价函数中的一部分项来估计代价函数的期望值。

基本算法

随机梯度下降

随机梯度下降（SGD）及其变种很可能是一般机器学习中应用最多的优化算法，特别是在深度学习中。按照数据生成分布抽取 $m$ 个小批量样本，通过计算它们的梯度均值，我们可以得到梯度的无偏估计。

卷积网络

卷积网络，也叫做卷积神经网络，是一种专门用来处理具有类似网格结构的数据的神经网络。例如时间序列数据（可以认为是在时间轴上有规律地采样形成的一维网格）和图像数据（可以看作是二维的像素网络）。

“卷积神经网络”一词表明该网络使用了卷积这种数学运算。卷积是一种特殊的线性运算。卷积网络是指那些至少在网络的一层中使用卷积运算来替代一般的矩阵乘法运算的神经网络。

卷积运算

在通常形式中，卷积是对两个实变函数的一种数学运算。
卷积运算通常用星号表示：
$s (t) = (x * w) (t) .$
在卷积网络的术语中，卷积的第一个参数（ $x$ ）通常叫做输入，第二个参数（函数 $w$ ）叫做核函数。输出有时被称作特征映射。

动机

卷积运算通过三个重要的思想来帮助改进机器学习系统：稀疏交互、参数共享、等变表示。
参数共享是指一个模型的多个函数中使用相同的参数。

池化

卷积网络中一个典型层包含三级。

在第一级中，这一层并行地计算多个卷积产生一组线性激活响应。
在第二级中，每一个线性激活响应将会通过一个非线性的激活函数，例如整流线性激活函数。这一级有时也被称为探测级。
在第三级中，我们使用池化函数来进一步调整这一层的输出。

池化函数使用某一位置的相邻输出的总体统计特征来代替网络在该位置的输出。
例如，最大池化函数给出相邻矩形区域内的最大值。

序列建模：循环和递归网络

循环神经网络或RNN是一类用于处理序列数据的神经网络。

深度循环网络

大多数RNN中的计算可以分解成三块参数及其相关的变换：

从输入到隐藏状态
从前一隐藏状态到下一隐藏状态，以及
从隐藏状态到输出

递归神经网络

递归神经网络代表循环网络的另一个扩展，它被构造为深的树状结构而不是RNN的链状结构，因此是不同类型的计算图。

应用

级联

计算机视觉

预处理

对比度归一化

全局对比度归一化 $（ G C N)$ 旨在通过从每个图像中减去其平均值，然后重新缩放使得其像素上的标准差等于某个常数 $s$ 来防止图像具有变化的对比度。

白化：与直觉相反的是，存在被称为 $s p h e r i n g$ 的预处理操作，并且它不同于 $G C N$ 。
$s p h e r i n g$ 并不会使数据位于球形壳上，而是将主成分重新缩放以具有相等方差。 $s p h e r i n g$ 通常被称为白化。

局部对比归一化通常可以通过使用可分离卷积来计算特征映射的局部平均值和局部标准差，然后在不同的特征映射上使用逐元素的减法和除法。

数据集增强

语音识别

语音识别任务在于将一段包括了自然语言发音的声学信号投影到对应说话人的词序列上。

之前，最先进的语音识别系统是隐马尔可夫模型（HMM)和高斯混合模型(GMM)的结合。GMM对声学特征和音素之间的关系建模，HMM对音素序列建模。
之后，随着更大更深的模型以及更大的数据集的出现，通过使用神经网络代替GMM来实现将声学特征转化为音素的过程可以大大提高识别的精度。

自然语言处理

$n - g r a m$

语言模型定义了自然语言中标记序列的概率分布。

神经语言模型

神经语言模型是一类用来克服维数灾难的语言模型，它使用词的分布式表示对自然语言序列建模。

其他应用

推荐系统

协同过滤

强化学习需要权衡探索与利用。
利用指的是从目前学到的最好策略采取动作，也就是我们所知的将获得高奖励的动作。
探索是指采取行动以获得更多的训练数据。

第三部分深度学习研究

线性因子模型
独立成分分析

慢特征分析

慢特征分析是使用来自时间信号的信息信号不变特征的线性因子模型。
慢特征分析的想法源于所谓的慢性原则。其基本思想是，与场景中其描述作用的单个量度相比，场景的重要特性通常变化地非常缓慢。

蒙特卡罗方法

随机算法可以粗略地分为两类：Las Vegas算法和蒙特卡罗算法。

采样与蒙特卡罗方法

重要采样

最优重要采样
有偏重要采样

马尔可夫链蒙特卡罗方法

Gibbs采样

深度生成模型

玻尔兹曼机

玻尔兹曼机的学习算法基于最大似然。

深度信念网络

深度信念网络是第一批成功应用深度架构训练的非卷积模型之一。

主要有两种方法可以处理深度玻尔兹曼机的联合训练问题。
第一个是中心化深度玻尔兹曼机。
第二个是使用多预测深度玻尔兹曼机

仿生程序员会梦见电子羊吗

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《深度学习》笔记（二）

第二部分深度网络：现代实践第三部分深度学习研究
复制链接

扫一扫

专栏目录

仿生程序员会梦见电子羊吗 CSDN认证博客专家 CSDN认证企业博客

码龄4年

127: 原创

6576: 周排名

1万+: 总排名

17万+: 访问

: 等级

1934: 积分

4527: 粉丝

367: 获赞

33: 评论

879: 收藏

私信

关注

热门文章

分类专栏

最新评论

【区块链技术与应用】（四）
风间琉璃442: Create channel and join error: Create channel error: error should be nil for SaveChannel of orgchannel: create channel failed: create channel failed: SendEnvelope failed: calling orderer 'orderer.example.com:7050' failed: Orderer Server Status Code: (400) BAD_REQUEST. Description: error applying config update to existing channel 'mychannel': error authorizing update: error validating ReadSet: proposed update requires that key [Group] /Channel/Application be at version 0, but it is currently at version 1 请问文中遇到这个报错是怎么解决的
【数据结构与算法设计】知识点复习-第五章-树形结构
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【数据结构与算法设计】知识点复习-第四章-串和数组
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【计算机网络】基础知识复习-第二章-计算机网络体系结构与协议
CSDN-Ada助手: 网络技能树或许可以帮到你：https://edu.csdn.net/skill/network?utm_source=AI_act_network
【大数据基础】基于信用卡逾期数据的Spark数据处理与分析
sun_shengsheng: 这个可以直接在anaconda上进行嘛

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。