第2.3章知识点------深度学习框架

本文介绍了深度学习框架的基本概念,重点关注了PyTorch的特点,包括动态图、灵活性和易用性。此外,详细讨论了过拟合和欠拟合现象,以及如何通过增加数据量、简化模型、正则化等方法来解决这些问题。
摘要由CSDN通过智能技术生成

1.什么是深度学习框架
深度学习框架是一种用于构建、训练和部署深度神经网络模型的工具集合。它提供了丰富的函数和工具,使开发者能够方便地创建、调整和优化神经网络模型。

2.深度学习框架有哪些
目前常用的深度学习框架有PyTorch、 Theano、 TensorFlow、 Keras、Caffe、MXNet、CNTK、PaddlePaddle。

3.深度学习框架应用
计算机视觉、自然语言处理、语音识别、机器
学习等多个领域。

4.PyTorch简介
PyTorch是一个开源的深度学习框架,它基于Python语言开发,专为深度学习和科学计算设计。Torch使用了一种不是很大众的语言Lua作为接口。Lua简洁高效,但由于其过于小众,以至于很多人听说要掌握Torch必须新学一门语言就望而却步,但Lua其实是一门比Python还简单的语言。PyTorch因其动态图、灵活性、易用性和强大的社区支持而在深度学习领域获得了广泛的应用。

5.PyTorch特点
(1)PyTorch 既可以看作为加入了GPU 支持的numpy。TensorFlow Caffe都是命今式的编程语言,而且是静态的,即首先必须构建一个神经网络,然后一次又一次使用同样的结构;如果想要改变网络的結构,就必须从头开始。但PyTorch通过一种反向自动求导的技术,可以让用户零延迟地任意改变神经刚络的行为。
(2)PyTorch 的设计思路是线性、直观且易于使用的,当用户执行一行代码时,它会忠实地执行,所以当用户的代码出现Bua 的时候、可以通过这些信息轻松快捷地找到出错的代码.不会让用户在Debua的时候因为错误的指向或者异步和不透明的引擎浪费太多的时间。
(3)PyTorch 的代码相对于TensorFlow 而言,更加简洁直观,同时TensorFlow高度工业化的底层代码,PyTorch 的源代码就要友好得多,更容易看懂。深入API,理解PyTorch 底层肯定是一件令人高兴的事。

6.什么是过拟合
过拟合是指模型在训练集上表现得过于完美,但在实际应用中对新数据的泛化能力却很差的现象。具体来说,过拟合发生在模型学习到了训练数据中的噪声和细节,以至于它失去了对未知数据的预测能力。
过拟合的出现通常是因为模型的复杂度过高,或者训练数据量太少,或者数据中的噪声太多。这导致模型捕捉到了训练集中的特定模式,而不是数据的真实分布。

7.如何解决过拟合
(1)增加数据量:通过获取更多的训练数据,可以帮助模型学习到更普遍的特征,而不是过分依赖训练集中的特定模式。
(2)简化模型:减少模型的复杂度,例如在神经网络中减少层数或神经元的数量,或者选择更简单的算法,以避免模型捕捉到训练集中的噪声。
(3)正则化:这是一种降低模型泛化误差的方法,可以通过在损失函数中添加一个正则项来惩罚模型的复杂度,鼓励模型选择更简单的解释。
(4)使用dropout:在训练神经网络时,dropout是一种有效的正则化技术,它通过随机丢弃一部分神经元的输出来减少模型对特定训练样本的依赖。
(5)交叉验证:使用交叉验证来评估模型的性能,确保模型在不同的数据子集上都能表现良好,从而减少过拟合的风险。
(6)早停(Early Stopping):在训练过程中,一旦发现验证误差开始增加,就停止训练,以防止模型过度拟合训练数据。
(7)集成学习:通过组合多个不同的模型来提高泛化能力,因为不同的模型可能在不同的方面出现过拟合。
(8)降维和特征选择:减少输入特征的数量,只保留最有用的特征,可以降低模型的复杂度,减少过拟合的可能性。
(9)调整模型参数:对于某些算法,如支持向量机(SVM)或神经网络,调整其参数(如核函数的参数或层间连接)也可以帮助减少过拟合。

8.导致过拟合的原因
(1)模型复杂度过高:如果模型的复杂度超过了训练数据的需求,模型可能会捕捉到数据中的噪声和不重要的特征,而不是真实的、有意义的模式。
(2)训练集大小不足:较小的训练集可能无法提供足够的信息来训练一个复杂的模型,导致模型过度关注训练集中的细节。
(3)训练集和测试集分布不一致:如果训练集和测试集的特征分布不同,模型可能在训练集上学到了不适用于测试集的特征。
(4)数据中的噪声过多:数据中的噪声可能误导模型,使其学习到错误的模式。
(5)迭代次数过多:过多的训练迭代可能导致模型过度拟合训练数据中的噪声和没有代表性的特征。

9.什么是欠拟合
欠拟合是指模型在训练集上表现不佳,无法获得足够低的误差,即模型复杂度过低,未能学习到数据背后的规律。
欠拟合通常发生在模型过于简单,无法捕捉数据集中的全部或大部分特征,或者训练过程中迭代次数不足,模型未能充分学习训练数据。这导致模型不仅在训练集上表现不佳,而且在测试集或验证集上也表现不佳,因为模型没有学会如何泛化。

10.导致欠拟合的原因
(1)模型复杂度过低:当模型过于简单,它可能无法捕捉到数据中的关键特征和模式,导致无法很好地拟合所有训练数据。
(2)特征选择不当:如果选取的特征无法反映数据的真实分布,模型的性能可能会受到影响。
(3)数据未归一化:在神经网络训练中,数据归一化是一个重要步骤。如果忽略这一步骤,可能导致模型性能表现不佳。

11.如何解决欠拟合
(1)增加特征:通过引入新的特征或特征组合,可以增大模型的假设空间,使其能够捕捉到数据中更多的变化和规律。
(2)使用非线性模型:考虑使用如核SVM、决策树或深度神经网络(DNN)等非线性模型,这些模型通常能更好地捕捉数据中的复杂关系。
(3)调整正则化参数:如果模型中包含正则化项,可以尝试减小正则化参数λ,以减少对模型复杂度的限制,允许模型学习更复杂的关系。
(4)Boosting方法:采用Boosting方法,如Gradient Boosting,这些方法通常有较小的偏差,有助于改善模型的拟合能力。
(5)增加训练数据量:虽然欠拟合通常与模型复杂度不足有关,但在一些情况下,增加训练数据量也可能有助于模型学习到更多的信息,从而提高其表现。
(6)添加多项式特征:在机器学习算法中,通过添加二次项或三次项等高次项特征,可以使模型具有更强的泛化能力。
(7)上下文特征:根据具体的应用场景,可以考虑添加上下文特征或平台特征等,这些特征能够提供额外的信息,帮助模型更好地理解数据。

12.交叉验证方法
(1)留出法 (Holdout cross validation)·按照固定比例将数据集静态的划分为训练集、验证集、测试集。
(2)自组法 (bootstrapping)适合于样本数目较少,有放回的取法。
(3)k折交叉验证: (k-fold crossvalidation)k一般取10
a.将数据集分为训练集和测试集,将测试集放在一边
b.将训练集分为k份
c.每次使用K份中的1份作为验证集,其他全部作为训练集。
d.通过k次训练后,我们得到了k个不同的模型。
e.评估k个模型的效果,从中挑选效果最好的超参数
f.使用最优的超参数,然后将k份数据全部作为训练集重新训练模型,得到最终模型。

13.正则化
正则化
14.监督学习分类
分类评估指标
精确率
召回率
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值