伯禹ElitesAI·动手学深度学习PyTorch版——task03

最新推荐文章于 2024-10-25 16:01:48 发布

pilgrimhoho

最新推荐文章于 2024-10-25 16:01:48 发布

阅读量157

点赞数

文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/pilgrimhoho/article/details/104305228

版权

一、循环神经网络进阶——处理梯度较容易出现衰减或爆炸（BPTT）问题

1.GRU(重置⻔、更新⻔)

2.LSTM(遗忘门、输入门、输出门、记忆细胞)

3.深度循环神经网络——用上一层的输出作为下一层的输入

4.双向循环神经网络——考虑前后的值对它的影响

二、过拟合和欠拟合

1.欠拟合：模型无法得到较低的训练误差

2.过拟合：模型的训练误差远小于它在测试数据集上的误差

模型复杂度低容易造成欠拟合，高容易造成过拟合

数据集太小容易造成过拟合

解决过拟合的方法：权重衰减（L2 范数正则化）和丢弃法

三、

1.梯度消失和梯度爆炸——当层数较多时，梯度的计算也容易出现消失或爆炸

2.随机初始化模型参数

（1）PyTorch的默认随机初始化——线性主要使用正态分布的随机初始化方式

（2）Xavier随机初始化

3.考虑环境因素

（1）协变量偏移——样本发生本质改变，标签不变

（2）标签偏移 ——测试集中出现训练集没有的标签

（3）概念偏移——一个单词包含不同概念

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pilgrimhoho

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

PyTorch深度学习实战（17）——多任务学习

盼小辉丶的博客

09-20

2288

伯禹ElitesAI·动手学深度学习PyTorch版——task01

pilgrimhoho的博客

02-12

247

一、优化函数 - 随机梯度下降在深度学习中的应用——小批量随机梯度下降模型参数初始化——如随机选择随机均匀采样小批量样本用小样本训练平均损失函数，同时求梯度（求偏导）用梯度结果*学习率与模型参数相减得到新的参数 (w,b)←(w,b)−η∣B∣∑i∈B∂(w,b)l(i)(w,b) (\mathbf{w},b) \leftarrow (\mathbf{w},b) - \frac{\eta...

参与评论您还未登录，请先登录后发表或查看评论

ElitesAI·动手学深度学习PyTorch版学习笔记-卷积神经网络基础；leNet；卷积神经网络进阶

liuyi6111的博客

02-18

211

宅家中看到Datawhale的学习号召，在大牛云集的群上找到了一个很佛系的小组，战战兢兢地开始了小白的深度学习之旅。感谢Datawhale、伯禹教育、和鲸科技，感谢课程制作者、组织者、各位助教以及其他志愿者！ 1 卷积神经网络基础 1.1 二维卷积本小节介绍了二维卷积，主要用于图像数据（刚好是二维的数据）处理。二维卷积通过输入二维数据和二维核数据的运算（卷积），得到一个小于输入数据的二维输...

ElitesAI·动手学深度学习PyTorch版-第一次打卡

qq_40896597的博客

02-12

327

1、线性回归 1.1 线性回归的基本要素模型为了简单起见，这里我们假设价格只取决于房屋状况的两个因素，即面积（平方米）和房龄（年）。接下来我们希望探索价格与这两个因素的具体关系。线性回归假设输出与各个输入之间是线性关系: 数据集我们通常收集一系列的真实数据，例如多栋房屋的真实售出价格和它们对应的面积和房龄。我们希望在这个数据上面寻找模型参数来使模型的预测价格与真实价格的误差最小。在机器学习...

《动手学深度学习（Pytorch版）》Task01：初识深度学习——4.22打卡

无名小秃瓢的博客

04-22

1496

（gradient descent）：常用的优化算法，在每个步骤中，梯度下降法都会检查每个参数，看看如果仅对该参数进行少量变动，训练集损失会朝哪个方向移动。然后，它在可以减少损失的方向上优化参数。（neural networks）：一种模仿生物神经网络（动物的中枢神经系统，特别是大脑）的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。（reinforcement learning）：让智能体(agent)在与环境交互的过程中，通过学习最优的行为策略，来实现最大的回报或目标。

【机器学习】《动手学深度学习 PyTorch版》李沐深度学习笔记

qq_44832832的博客

11-14

3123

【机器学习】《动手学深度学习 PyTorch版》李沐深度学习笔记

动手学深度学习PyTorch版-task1

zahidzqj的博客

02-13

2972

课程介绍（引用自伯禹平台：https://www.boyuai.com/elites/course/cZu18YmweLv10OeV）本课程面向希望更多的通过代码实践去学习深度学习原理的同学和在职人士。《动手学深度学习》是2019年国内最受欢迎的人工智能学习教材之一，伯禹教育携手上海交通大学团队，以此书的知识架构为基础，沿用了其中的原理讲解文档，并将代码框架由MXNET迁移至PyTorch...

《动手学深度学习》PyTorch 版本总结（1）

CV前沿

02-14

1528

通过伯禹学习平台和Kesic平台，参与了一项14天学习《动手学深度学习》课程，这本书是由李沐等大神编写而成，并提供了配套的视频和源代码。这次活动主要是将里面的Mxnet 框架改成了PyTorch 框架实现了一遍，并由上海交大的老师们再次讲述了一遍。以下内容均是记录学习过程中的一些学习知识点。 Task 01 （1）线性回归知识点1 在求数值解的优化算法中，小批量随机梯度下降（mini-batch...

深度学习（PyTorch）——残差网络（ResNet）

qq_42233059的博客

08-28

2734

深度学习（PyTorch）——残差网络（ResNet）

伯禹公益AI《动手学深度学习PyTorch版》Task 05 学习笔记

01-06

伯禹公益AI《动手学深度学习PyTorch版》Task 05 学习笔记 Task 05：卷积神经网络基础；LeNet；卷积神经网络进阶微信昵称：WarmIce 昨天打了一天的《大革命》，真挺好玩的。不过讲道理，里面有的剧情有点为了“动作...

ElitesAI·动手学深度学习PyTorch版TASK3、4、5

01-20

第二次打卡 1.关于验证数据集的描述错误的是：测试数据集可以用来调整模型参数验证数据集可以用来调整模型参数在数据不够多的时候，k折交叉验证是一种常用的验证方法 k折交叉验证将数据分为k份，每次选择一份用于...

伯禹公益AI《动手学深度学习PyTorch版》Task 06 学习笔记

01-06

伯禹公益AI《动手学深度学习PyTorch版》Task 06 学习笔记 Task 06：批量归一化和残差网络；凸优化；梯度下降微信昵称：WarmIce 批量归一化和残差网络 BN和ResNet都没什么特别好说的。 DenseNet久闻其名，但是一直...

基于神经网络的农业病虫害损失预测

最新发布

2401_84457171的博客

10-25

261

【摘要】鉴于农业病虫害经济损失的预测具有较强的复杂性和非线性特性，设计了一种新型的GRNN预测模型，对农业病虫害经济损失进行预测。病虫害经济损失评估系统作为社会经济系统的一个子系统，在受外界因素影响和作用的同时，对外部经济系统也具有一定的反作用，使其受到来自系统内外两方面因素的影响。同时，作为气象基础设施建设投资决策的基础，病虫害造成的损失不仅涉及农林牧降低产量的问题，而且与整个国民经济密切相关，因此它在国家和区域经济发展规划中具有十分重要的地位[1]。

从0开始深度学习（19）——参数管理

立志成为炼丹师？

10-24

1290

w∼U510可能性140可能性12U−10−5可能性14U(5, 10) & \text{ 可能性 } \frac{1}{4} \\0 & \text{ 可能性 } \frac{1}{2} \\U(-10, -5) & \text{ 可能性 } \frac{1}{4}w∼⎩⎨⎧U5100U−10−5可能性41可能性21可能性41w从均匀分布U510中取值。

基于深度学习的音乐生成与风格转换

weixin_42605076的博客

10-24

1167

音乐风格通常由节奏、和声、旋律、乐器编制、音色等要素决定。风格转换的核心在于保持音乐作品的核心旋律、节奏或主题不变的前提下，调整其和声、伴奏模式或音色以适应目标风格。基于深度学习的音乐生成与风格转换技术具有广泛的应用潜力，不仅能够自动创作出新颖的音乐作品，还可以实现不同风格之间的无缝转换。随着模型性能的不断提升和应用场景的扩展，这一领域将在未来为音乐创作、娱乐和教育等领域带来更多的创新与变革。

ADAMG——深度学习无参数优化的新时代

知来者逆的博客

10-24

679

黄金步长的引入是为了在保持 AdaGrad-Norm 收敛性能的同时，接近预期的最佳步长。这种步长与具体问题的特征无关，有望在各种训练条件下促进一致有效的收敛（见图 1）。ADAMG 是一种基于 AdaGrad-Norm 的无参数优化算法，它使用黄金步长为各种优化任务自动提供最佳学习率。实验结果表明，与传统优化方法相比，ADAMG 具有更高的稳定性和效率。特别是在计算资源有限或处理大型数据集的情况下，该算法可以有效地保持高性能，同时减少人工调整的工作量。

【进阶OpenCV】（21） --卷积神经网络实现人脸检测

m0_74896766的博客

10-21

776

本篇介绍了如何通过使用dlib库中的卷积神经网络（CNN）人脸检测模型来检测一张图片中的人脸。注意！！：为例减少模型的计算，使用加载的CNN人脸检测模型对图片进行人脸检测时，上采样次数可以少一点。

动手学深度学习pytorch环境搭建gpu

09-03

为了在GPU上搭建动手学深度学习pytorch环境，你需要按照以下步骤进行操作。首先，你需要安装Anaconda来管理你的Python环境。你可以从官方网站 https://www.anaconda.com/ 下载适用于你操作系统的Anaconda安装程序...