深度学习模型训练时损失在下降但是波动较大_一个案例掌握深度学习

人工智能越来越火,甚至成了日常生活无处不在的要素。人工智能是什么?深度学习、机器学习又与人工智能有什么关系?作为开发者如何进入人工智能领域? 近期我们将连载一个深度学习专题,由百度深度学习技术平台部主任架构师毕然分享,让你快速入门深度学习,参与到人工智能浪潮中。 从本专题中,你将学习到:
  1. 深度学习基础知识
  2. Numpy实现神经网络构建和梯度下降算法
  3. 计算机视觉领域主要方向的原理、实践
  4. 自然语言处理领域主要方向的原理、实践
  5. 个性化推荐算法的原理、实践
这是本系列第二篇 本文内容主要包括:
  1. 数据处理和异步数据读取
  2. 网络结构设计及背后思想
  3. 损失函数介绍及使用方式
  4. 模型优化算法介绍和选择
  5. 分布式训练方法及实践
  6. 模型训练调试与优化
  7. 训练中断后恢复训练
涵盖了深度学习的 数据处理、模型设计、模型训练与模型优化等部分,如下图所示,另外扩展了异步数据读取、分布式训练与恢复训练等知识点。

873821f97bebcc66772d2802a7524e8f.png

第一节: 数据处理与数据读取 深度学习算法工程师多被称为“炼丹师”,训练深度学习模型则等同于“炼丹”。殊不知,在炼丹之前,重要的一步就是“采药”。采药是炼丹的第一步,同训练深度模型需要准备训练数据。 官方给出的数据集比如ImageNet、 MSCOCO与VOC等,这些数据都比较干净,没有标注错误或者漏标注的问题。但是如果是自己的业务数据集,数据可能存在各种问题,需要自己去实现数据处理的函数,构建数据读取器。 以本地读取的mnist数据集为例,会涉及代码实现以下几个方面:
  1. 从文件中读取到数据;
  2. 划分数据集为训练集,验证集;
  3. 构建数据读取器(data_loader)
c1af25c71f4b4c12f88c39a5e942bdb7.png
图:mnist数据处理 不同的数据保存的文件格式和存储形式不尽相同,正确读到数据往往是开始训练的第一步。 第二节: 神经网络模型设计 了解一下深度神经网络的设计原理。 深度神经网络相比较浅层深度神经网络的区别是:网络足够深,足够复杂,非线性程度更高。 复杂的模型可以拟合更复杂的函数,对现实世界的表征能力也会增强。非线性程度的增加通过模型的深度和非线性函数来实现,如果没有非线性函数,即使最深的神经网络也只不过是一种线性函数表达。 组建网络时,一般考虑到训练数据的数量
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值