一、学习总任务
二、完成任务2-1
Task02—回归
Part1:任务综述
根据视频讲解,本任务需要掌握回归定义,模型步骤,验证已经训练好的模型的好坏,过拟合问题以及优化的步骤。扩展知识主要掌握线性模型的整体知识框架及涉及线性回归的知识。其他知识在后继任务中有所描述。
Part2: 主要内容笔记
本次学习除了李宏毅的视频讲解,结合周志华的《机器学习》等相关内容进行了知识的深入扩展。从另一个角度进行学习总结。
根据机器学习的模块模型,了解到数据经过预处理后,根据数据是否有标签分为了监督和无监督学习。监督学习主要有分类和回归;无监督学习主要是聚类;优化的方法有最小二乘法,梯度下降法。
1.线性回归
线性关系是一种确定关系。而在现实生活中也存在一种情况,变量X和变量Y之间有一定的关系,但是也没有密切到通过X唯一确定Y的程度。这种关系我们称之为相关关系(非确定性关系)。那么线性回归的主要任务是找到一条直线很好地拟合若个训练数据在坐标中表示的点。
拟合误差要最小即最好。那么公式
结合李宏毅知识模块也可以理解成:Regression 就是找到一个函数 function ,通过输入特征 x,输出一个数值 Scalar。
线性回归应用也非常广泛,比如股市预测,自动驾驶,商品推荐等。李宏毅课堂中主要是以以下应用为例:
- Pokemon精灵攻击力预测(Combat Power of a pokemon):
- 输入:进化前的CP值、物种(Bulbasaur)、血量(HP)、重量(Weight)、高度(Height)
- 输出:进化后的CP值
要想有一个最优的预测结果,就应该构建最优的模型。
模型步骤:
- step1:模型假设,选择模型框架(线性模型)
- step2:模型评估,如何判断众多模型的好坏(损失函数)
- step3:模型优化,如何筛选最优的模型(梯度下降)
【说在前面的话】 由于以上知识点具有综合性,故在分解讲解模型步骤之前,首先从宏观上了解另一个知识框架。如下图。我们知道线性回归是隶属于线性模型中的一块重要的内容,它是最简单的模型,也是重要的模型之一,涉及内容也很多,主要了解一元线性回归。
(1)线性模型的基本形式
学习问题描述、函数形式、向量形式三个方面。
(2)一元线性回归
一元线性模型是有单个特征
待续~