动手学深度学习v2 ------笔记2

最新推荐文章于 2024-10-04 05:48:08 发布

不想转生信的小张

最新推荐文章于 2024-10-04 05:48:08 发布

阅读量748

点赞数

分类专栏：机器学习文章标签：深度学习笔记人工智能

本文链接：https://blog.csdn.net/Nana_Oyang/article/details/132346756

版权

机器学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

前言

提示：本文要记录的大概内容：

动手学深度学习v2 ------ 沐神

提示：以下是本篇文章正文内容

一、多层感知机

1.模型选择

在机器学习中，我们通常在评估几个候选模型后选择最终的模型。这个过程叫做模型选择。

2.训练误差和泛化误差

1.训练误差（training error）是指，模型在训练数据集上计算得到的误差。 2.泛化误差（generalization error）是指，模型应用在新数据集上的误差。
3.模考与高考的区别。

1.验证集与测试集

1.解决此问题的常见做法是将我们的数据分成三份，除了训练和测试数据集之外，还增加一个验证数据集（validation dataset），也叫验证集（validation set）。
2.评估模型好坏。val、验证集和训练集不能混在一起。
3.我们只会使用测试数据一次，以评估最好的模型或比较一些模型效果。一但放生无法改变。

2. K折交叉验证

1.当训练数据稀缺时，我们甚至可能无法提供足够的数据来构成一个合适的验证集。
2.原始训练数据被分成K个不重叠的子集。然后执行K次模型训练和验证，每次在K-1个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证。最后，通过对K次实验的结果取平均来估计训练和验证误差。

3.过拟合和欠拟合

在这里插入图片描述
1.欠拟合：没训练好。
2.过拟合：简单数据集上用了很深的神经网络。

1. 模型容量

在这里插入图片描述

2. 模型容量的影响

在这里插入图片描述
1.训练误差：对数据的拟合能力。
2.泛化误差：真正的误差。容易被无关的细节困扰。

3. 总结

在这里插入图片描述

4.权重衰退

处理过拟合的一种方法。实际上，限制特征的数量是缓解过拟合的一种常用技术。

1.均方范数

1.硬性

L2范数
在这里插入图片描述

2.柔性

原始损失和阀
在这里插入图片描述

3.参数更新

在这里插入图片描述

2.小结

1.正则化是处理过拟合的常用方法：在训练集的损失函数中加入惩罚项，以降低学习到的模型的复杂度。
2.保持模型简单的一个特别的选择是使用 𝐿2惩罚的权重衰减。这会导致学习算法更新步骤中的权重衰减。
3.权重衰减功能在深度学习框架的优化器中提供。
4.在同一训练代码实现中，不同的参数集可以有不同的更新行为。