pytorch学习心得

验证数据集
从严格意义上讲,测试集只能在所有超参数和模型参数选定后使用一次。不可以使用测试数据选择模型,如调参。由于无法从训练误差估计泛化误差,因此也不应只依赖训练数据选择模型。鉴于此,我们可以预留一部分在训练数据集和测试数据集以外的数据来进行模型选择。这部分数据被称为验证数据集,简称验证集(validation set)。例如,我们可以从给定的训练集中随机选取一小部分作为验证集,而将剩余部分作为真正的训练集。

K折交叉验证
由于验证数据集不参与模型训练,当训练数据不够用时,预留大量的验证数据显得太奢侈。一种改善的方法是K折交叉验证(K-fold cross-validation)。在K折交叉验证中,我们把原始训练数据集分割成K个不重合的子数据集,然后我们做K次模型训练和验证。每一次,我们使用一个子数据集验证模型,并使用其他K-1个子数据集来训练模型。在这K次训练和验证中,每次用来验证模型的子数据集都不同。最后,我们对这K次训练误差和验证误差分别求平均。

过拟合和欠拟合
接下来,我们将探究模型训练中经常出现的两类典型问题:

一类是模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting);
另一类是模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合(overfitting)。 在实践中,我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题,在这里我们重点讨论两个因素:模型复杂度和训练数据集大小。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch是一个非常流行的深度学习框架,拥有丰富的学习资源。以下是一些关于PyTorch学习资源的介绍: 1. 官方文档:PyTorch官方网站提供了非常完善的文档,其中包含了丰富的教程、示例代码和官方指南。这些文档详细介绍了PyTorch的各种功能和用法,对新手入门非常友好。 2. 社区教程:PyTorch拥有活跃的社区,许多社区成员会分享自己的教程和博客文章。通过搜索引擎可以找到大量开源的教程和博客,这些资源对于深入理解PyTorch的原理和应用非常有帮助。 3. PyTorch官方课程:PyTorch官方提供了一系列免费的在线课程,包括入门教程、深入课程和专题讲座。这些课程结合了理论和实践,对于学习者来说是非常有价值的学习资源。 4. 开源项目和代码库:GitHub上有很多优秀的PyTorch开源项目和代码库,可以供学习者参考和学习。这些项目包含了各种PyTorch的应用和实现,可以帮助学习者更好地理解PyTorch的用法和实践。 5. MOOC课程:一些在线教育平台提供了关于PyTorch的在线课程,如Coursera、Udacity和edX等。这些课程由专业的教师和研究人员设计,对于系统性地学习PyTorch非常有帮助。 总的来说,PyTorch拥有丰富的学习资源,包括官方文档、社区教程、PyTorch官方课程、开源项目和代码库以及在线MOOC课程等。通过利用这些资源,学习者可以系统地掌握PyTorch的基本概念、用法和应用,从而更好地进行深度学习开发和研究。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值