一.再看线性回归
之前我们选择线性回归的时候,只是认为那些数据看上去很符合线性的样子,选择最小平方损失函数的时候,也是直接提出来的,没有考虑过为什么会是这个样子。接下来就从概率的角度来解释这些问题。
首先假设目标变量和输入与下面这个方程相关:
其中是一个误差项(error term),来捕捉一些我们建模的时候故意或者无意忽略但是对于预测有影响的因素。有时候也可以作为一个随机的噪声(random noise)。“误差项(噪声项)”的引入允许我们获得参数值和预测的置信程度。
我们进一步假设独立同分布且服从均值为0,方差为高斯分布,那么我们能够把这个假设写为,即的概率密度是: