哈工大神经网络与深度学习知识总结（二）

最新推荐文章于 2024-09-07 07:24:07 发布

lijitt

最新推荐文章于 2024-09-07 07:24:07 发布

阅读量166

点赞数

文章标签：深度学习神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lijitt/article/details/129776677

版权

目录

4.2自适应梯度算法

4.3性能优化问题描述

4.4二阶算法

4.5常用技巧

5.卷积神经网络基础

5.1 深度学习平台介绍

5.2卷积神经网络基础

4.1动量法

SGD问题：病态曲率，由于两边过于陡峭，导致搜索点一直在山沟两边碰撞，前进速度慢。

为了解决以上问题，我们引入了动量法。

更新公式：

4.2自适应梯度算法

AdaGrad（Adaptive Gradient）：自适应梯度

ROMSProp(Root Mean Square Prop)

Adam

4.3性能优化问题描述

权值 𝐰 取何值，指标函数 𝐽(𝐰) 最小？恰恰是最优化方法中的基本问题：函数最小化。进一步，我们希望建立迭代形式，并且形式尽量简单。

考虑对函数进行展开

对于全局极小值点，局部极小值点，有如下两条特征：
1.一阶条件：必要条件 𝛻𝑓（ 𝐱 ∗） = 0 驻点
2.二阶条件：充分条件H半正定
鞍点指的式沿某方向是极大值点，沿另一方向是极小值点的点。

4.4二阶算法

牛顿法：对于二次型，有

最终得到

4.5常用技巧

训练数据与测试数据：

训练数据，验证数据，测试数据，通常三者比例为70%， 15%， 15%或60， 20， 20当数据很多时，训练和验证数据可适当减少。

𝐾折交叉验证：
原始训练数据被分成 K 个不重叠的子集。然后执行 K 次模型训练和验证，每次在 K-1 个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证。最后，通过对 K 次实验的结果取平均来估计训练和验证误差。

权重衰减：
欠拟合：误差一直比较大
过拟合：在训练数据集上误差小而在测试数据集上误差大
为防止过拟合和权值震荡，加入新的指标函数项：

第二项约束了权值不能过大。在梯度下降时，导数容易计算：

Dropout（暂退）：
在整个训练过程的每一次迭代中，标准暂退法包括在计算下一层之前将当前层中的一些节点置零。

模型初始化：
简单的考虑，把所有权值在[-1,1]区间内按均值或高斯分布进行初始化。

Xavier初始化：为了使得网络中信息更好的流动，每一层输出的方差应该尽量相等。因此需要实现下面的均匀分布：

5.卷积神经网络基础

5.1 深度学习平台介绍

PyTorch是一个Python的深度学习库。它最初由Facebook人工智能研究小组开发，而优步的Pyro软件则用于概率编程。最初，PyTorch由Hugh Perkins开发，作为基于Torch框架的LusJIT的Python包装器。PyTorch在Python中重新设计和实现Torch，同时为后端代码共享相同的核心C库。

除了Facebook之外，Twitter、GMU和Salesforce等机构都采用了 PyTorch。 O到目前，据统计已有80%的研究采用PyTorch，包括Google。

PyTorch基本使用

使用tensor表示数据
使用Dataset 、DataLoader读取样本数据和标签
使用变量(Variable)存储神经网络权值等参数
使用计算图(computational graph)来表示计算任务
在代码运行过程中同时执行计算图

5.2卷积神经网络基础

基本概念：

全连接网络：链接权过多，难算难收敛，同时可能进入局部极小值，也容易产生过拟合问题

局部连接网络：顾名思义，只有一部分权值连接部分输入和权值卷积。

填充：也就是在矩阵的边界上填充一些值，以增加矩阵的大小，通常用0或者复制边界像素来进行填充。

池化：使用局部统计特征，如均值或最大值解决特征过多问题。

卷积神经网络结构构成：由多个卷积层和下采样层构成，后面可连接全连接网络

卷积层：k个滤波器

下采样层：采用mean或max

后面：连着全连接网络

前向传播定义：

如果第 𝑙层是卷积+池化层，则：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
哈工大神经网络与深度学习知识总结（二）

哈工大神经网络与深度学习屈祯深
复制链接

扫一扫

lijitt CSDN认证博客专家 CSDN认证企业博客

码龄5年

4: 原创

161万+: 周排名

95万+: 总排名

1034: 访问

: 等级

40: 积分

2: 粉丝

0: 获赞

2: 评论

4: 收藏

私信

关注

热门文章

最新评论

哈工大神经网络与深度学习知识总结（四）
CSDN-Ada助手: 恭喜您写出了第四篇博客，标题看起来非常有深度。您的总结让读者能够更好地了解哈工大神经网络与深度学习知识。希望您能够继续保持创作的热情，给读者带来更多有价值的内容。下一步建议可以考虑扩展一些实际应用案例，让读者更好地理解知识在实际场景中的应用。非常感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
哈工大神经网络与深度学习知识总结（一）
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。