原学习网站:https://aistudio.baidu.com/aistudio/education/group/info/888
机器学习相关知识的参考网站:https://recomm.cnblogs.com/blogpost/5818027?page=3
一、前言
如果学员想了解更多关于飞桨、深度学习、机器学习或Python课程,可以通过如下三个途径获取:
AI Studio:https://aistudio.baidu.com/
飞桨官网:https://www.paddlepaddle.org.cn/
百度技术学院:http://bit.baidu.com/index
二、 机器学习和深度学习综述
(一) 人工智能、机器学习、深度学习的关系
- 概括来说,人工智能、机器学习和深度学习覆盖的技术范畴是逐层递减的。人工智能是最宽泛的概念。机器学习是当前比较有效的一种实现人工智能的方式。深度学习是机器学习算法中最热门的一个分支,近些年取得了显著的进展,并替代了大多数传统机器学习算法。三者的关系如 图1 所示,即:人工智能 > 机器学习 > 深度学习。
(二) 机器学习
- 机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。下面我们从机器学习的实现和方法论两个维度进行剖析,帮助我们更加清晰地认识机器学习的来龙去脉。
1. 机器学习的实现
2. 机器学习的方法论
- 模型假设: 世界上的可能关系千千万,漫无目标的试探Y~ X之间的关系显然是十分低效的。因此假设空间先圈定了一个模型能够表达的关系可能,如蓝色圆圈所示。机器还会进一步在假设圈定的圆圈内寻找最优的Y~X关系,即确定参数W。
- 评价函数: 寻找最优之前,我们需要先定义什么是最优,即评价一个Y~X关系的好坏的指标。通常衡量该关系是否能很好的拟合现有观测样本,将拟合的误差最小作为优化目标。
- 优化算法: 设置了评价指标后,就可以在假设圈定的范围内,将使得评价指标最优(损失函数最小/最拟合已有观测样本)的Y~X关系找出来,这个寻找的方法即为优化算法。最笨的优化算法即按照参数的可能,穷举每一个可能取值来计算损失函数,保留使得损失函数最小的参数作为最终结果。
(1)从上述过程可以得出,机器学习的过程与牛顿第二定律的学习过程基本一致,都分为假设、评价和优化三个阶段:
(2)机器执行学习的框架体现了其学习的本质是“参数估计”(Learning is parameter estimation)。
(三)深度学习
- 那么相比传统的机器学习算法,深度学习做出了哪些改进呢?其实两者在理论结构上是一致的,即:模型假设、评价函数和优化算法,其根本差别 在于假设的复杂度。
1. 神经网络的基本概念
- 人工神经网络包括多个神经网络层,如卷积层、全连接层、LSTM等,每一层又包括很多神经元,超过三层的非线性神经网络都可以被称为深度神经网络。通俗的讲,深度学习的模型可以视为是输入到输出的映射函数,如图像到高级语义(美女)的映射,足够深的神经网络理论上可以拟合任何复杂的函数。因此神经网络非常适合学习样本数据的内在规律和表示层次,对文字、图像和语音任务有很好的适用性。
- 神经元: 神经网络中每个节点称为神经元,由两部分组成:
- **加权和:**将所有输入加权求和。
- **非线性变换(激活函数):**加权和的结果经过一个非线性函数变换,让神经元计算具备非线性的能力。
- 多层连接: 大量这样的节点按照不同的层次排布,形成多层的结构连接起来,即称为神经网络。
- 前向计算: 从输入计算输出的过程,顺序从网络前至后。
- 计算图: 以图形化的方式展现神经网络的计算逻辑又称为计算图。我们也可以将神经网络的计算图以公式的方式表达如下:
由此可见,神经网络并没有那么神秘,它的本质是一个含有很多参数的“大公式”。
那么如何设计神经网络呢?下一章会以**“房价预测”**为例,演示使用Python实现神经网络模型的细节。
三、使用Python和Numpy构建神经网络模型
- 神经网络的基本概念(如神经元、多层连接、前向计算、计算图);
- 模型结构三要素(模型假设、评价函数和优化算法)。
- 本节将以“波士顿房价”任务为例,向读者介绍使用Python语言和Numpy库来构建神经网络模型的思考过程和操作方法。
见小论文仿真学习笔记–波士顿房价预测:https://blog.csdn.net/weixin_43938259/article/details/108648044