PaddlePaddle百度架构师手把手带你零基础实践深度学习学习笔记——零基础入门深度学习
1 前言
此课程为入门课程,感兴趣的小伙伴可以先补一下Python基础的代码编写阅读能力以及了解基础的机器学习和深度学习的理论知识。
课程特色:
特色一:原理与代码结合,讲解深入浅出,帮助学员快速掌握理论知识。
特色二:工业实践案例+作业题结合,帮助学员快速具备深度学习应用能力。
特色三:PaddlePaddle系列产品的一手资料
如想了解更多关于飞桨、深度学习、机器学习或Python课程,可以通过如下三个途径获取。
AI Studio:https://aistudio.baidu.com/
飞桨官网:https://www.paddlepaddle.org.cn/
百度技术学院:http://bit.baidu.com/index
2 机器学习和深度学习综述
2.1 三个概念的定义和关系
人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的。人工智能是最早提出的也是最宽泛的概念。机器学习是当前比较有效的一种实现人工智能的方式。深度学习是机器学习算法中最热门的一个分支,近些年取得了显著的进展,并替代了大多数传统机器学习算法。三者的关系如上图所示,即:人工智能 > 机器学习 > 深度学习。
机器学习三要素:假设、评价、优化
2.2 深度学习的历史和今天
经过半个多世纪的发展,深度学习的理论和应用逐步走向成熟。
3 使用Python语言和Numpy库来构建神经网络模型
3.1 波士顿房价预测问题
波士顿房价预测是一个经典的机器学习任务,类似于程序员世界的“Hello World”。和大家对房价的普遍认知相同,波士顿地区的房价是由诸多因素影响的。该数据集统计了13种可能影响房价的因素和该类型房屋的均价,期望构建一个基于13个因素进行房价预测的模型,如下图所示。
对于预测类问题,可以根据预测输出的类型是连续的实数值,还是离散的标签,区分为回归任务和分类任务。因为房价是一个连续值,所以房价预测显然是一个回归任务。下面我们尝试用最简单的线性回归模型解决这个问题,并用神经网络来实现这个模型。
线性回归模型
假设房价和各影响因素之间能够用线性关系来描述: y = ∑ j = 1 M x j w j + b y=\sum_{j=1}^{M} x_{j} w_{j}+b y=∑j=1Mxjwj+b
模型的求解即是通过数据拟合出每个 w j w_{j} wj 和 b b b。其中, w j w_{j} wj 和 b b b分别表示该线性模型的权重和偏置。一维情况下, w j w_{j} wj 和 b b b是直线的斜率和截距。
线性回归模型使用均方误差作为损失函数(Loss),用以衡量预测房价和真实房价的差异: M S E = 1 n ∑ i = 1 n ( Y ^ i − Y i ) 2 M S E=\frac{1}{n} \sum_{i=1}^{n}\left(\hat{Y}_{i}-Y_{i}\right)^{2} MSE=n1