回顾知识
线性回归
线性:函数里面的自变量和因变量之间的对应关系在集合呈现直线(平面或者超平面)
回归:用一条直线(平面或者超平面)来拟合真实世界中的一些规律
线性回归:线性回归就是用自变量和因变量之间的对应关系呈现一条直线的函数来进行拟合现实生活中的一些规律
一元线性回归
两个变量的数据进行线性回归,就是要找到一条直线来最好地代表散点图中的那些点
多元线性回归
逐步回归分析
逐步回归分析法的思想:
- 从一个自变量开始,视自变量Y作用的显著程度,从大到小地依次逐个引入回归方程
- 当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉
- 对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量
- 这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止
线性回归的损失函数
损失函数是一个贯穿整个机器学习重要的一个概念,大部分机器学习算法都会有误差,需要通过显性的公式来描述这个误差,并且将这个误差优化到最小值。对于线性回归模型,将模型与数据点之间的距离差之和做为衡量匹配好坏的标准,误差越小,匹配程度越大。 要找的模型就是需要将f(x)和真实值之间最相似的状态。
逻辑回归
逻辑回归不是回归,是用回归的办法做分类任务
回归任务:输入变量与输出变量均为连续变量的预测问题
分类任务:输出变量为有限个离散变量的预测问题