deeplearning.ai 吴恩达网上课程学习（九）——深度学习基础实践理论

最新推荐文章于 2023-11-28 13:29:44 发布

玥晓珖

最新推荐文章于 2023-11-28 13:29:44 发布

阅读量209

点赞数

分类专栏：深度学习深度学习基础 deeplearning.ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010327061/article/details/80024946

版权

深度学习同时被 3 个专栏收录

76 篇文章 11 订阅

订阅专栏

深度学习基础

35 篇文章 1 订阅

订阅专栏

deeplearning.ai

16 篇文章 0 订阅

订阅专栏

参考链接：https://www.missshi.cn/api/view/blog/5a1ff5cf9112b3493d000000

本文主要包括：

1. 训练、验证、测试集的划分

2. 对偏差和方差的理解，机器学习中解决高偏差/高方差的基本方法

3. 正则化基本理论和防止过拟合的方法

4. 如何加快训练速度

5. 梯度消失和梯度爆炸的概念

6. 梯度校验方法

1.训练、验证、测试集的划分

整个数据集分为训练集、验证集和测试集三个部分，我们需要利用训练集进行模型训练，然后通过验证集来判断我们训练模型的好坏，并找出其中最好的模型最终在测试集上进行评估。

在之前的小样本的机器学习（样本数量不大的时候（1W以下））应用中，一个常见的分配方式是进行三七分配：即70%的数据用于训练，而30%的数据用于进行验证。或者是6,2,2分配：即训练集、验证集和测试集分别占60%，20%，20%；当样本量是100W时，训练集、验证集和测试集分别占98%，1%，1%就足够了；如果样本量是1000万时，那么我们可以将训练集、验证集和测试集分别占99.6%，0.2%，0.2%。

真实的应用数据（可能比较模糊）与我们所能拥有的更为大量的数据（高清）并不来源于同一个分布，我们首先需要保证验证集和测试集是来源于同一分布且与真实应用场景的分布相同（都比较模糊），而训练集可以包含一部分模糊图片。

2. 方差和偏差：

欠拟合——高偏差；过拟合——高方差

如果的确偏差很大，对训练集都不能很好的拟合时：

采用更大的网络
训练更长的时间
换一个新的网络结构

当偏差降低到一个可接受的值时，我们将继续考虑其方差的问题。

如果方差很大，模型在验证集上表现出的性能并不足够好，我们通常可以考虑一下思路：

使用更多的数据进行训练
正则化
换一个新的网络结构

3.正则化基本理论：

① 解决过拟合（高偏差）问题原理：

② 正则化方法：

（1）L2正则化（上面的原理）

（2）Dropout方法：

Dropout的基本原理：遍历每层的神经元节点，并设置每层节点随机消失的概率。我们将会得到一个节点更少，网络更加简单的模型结构。

（3）数据扩充：

当我们无法获得更多的数据时，我们可以根据已有的数据来生成一些新的数据。以图像领域为例，我们可以对原始图像进行任意翻转、裁剪等来生成一些新的样本。

（4）Early stop

Early stop指的就是当验证集误差达到最低点后，就停止继续训练。
缺点：就是无法单独来保证偏差和方差两个指标。因为提前终止训练会导致偏差无法继续下降。

4.加快训练速度

归一化输入：（更容易的找到较优的值）

（1）零均值化：数据减去平均值；

（2）归一化方差：

5.梯度消失和梯度爆炸

梯度消失或梯度爆炸：我们在训练一个较大的神经网络时，随着网络层数的增加、导数的值可能会变得非常大或者非常小，而这将会导致训练的难度加大。

通过对网络权重进行合理的初始化，可以在一定程度上缓解梯度爆炸/消失问题。

6.梯度校验方法

如何进行梯度校验：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
deeplearning.ai 吴恩达网上课程学习（九）——深度学习基础实践理论

参考链接：https://www.missshi.cn/api/view/blog/5a1ff5cf9112b3493d000000本文主要包括：1. 训练、验证、测试集的划分2. 对偏差和方差的理解，机器学习中解决高偏差/高方差的基本方法3. 正则化基本理论和防止过拟合的方法4. 如何加快训练速度5. 梯度消失和梯度爆炸的概念6. 梯度校验方法1.训练、验证、测试集的划分整个数据集分为训练...
复制链接

扫一扫

专栏目录

玥晓珖 CSDN认证博客专家 CSDN认证企业博客

码龄11年

86: 原创

6万+: 周排名

162万+: 总排名

35万+: 访问

: 等级

3916: 积分

404: 粉丝

267: 获赞

177: 评论

1298: 收藏

私信

关注

热门文章

分类专栏

最新评论

TensorFlow中的name 和python代码中的变量名
wxmisaya1: 讲的非常清楚，感谢博主
安装Freesurfer遇到的问题
dou984: freeview图形显示不成功解决办法的链接已经失效了，求问大佬可以重发一个么
运行U-net进行图像分割
William苏十九: ValueError: A `Concatenate` layer requires inputs with matching shapes except for the concatenation axis. Received: input_shape=[(None, 128, 128, 256), (None, 64, 64, 512)] 请问博主一直报错这个怎么解决
运行U-net进行图像分割
yaoyikeke: 运行unethical.py，报错Input tensors to a Functional must come from `tf.keras.Input`. Received: Ellipsis (missing previous layer metadata).请问咋解决呀，我是新手
MATLAB读raw，dat文件代码
qq_38489415: 请问，如果raw转为mat时，reshape(data,[x, y, z]); 其中的x、y、z怎末查看设置呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。