记录一下线性回归推导。以后多写写博客,多记录
线性回归公式 其中,w0为参数,x0 为样本值,b 为偏执项
可以记为 (1)其中,wT为转置矩阵。
预测样本和真实值之间存在误差 其中 为误差
对于每个样本都存在误差 (2)
假设误差 是服从独立分布的,并且服从高斯分布,则有
(3)
将(2)代入(3)则有条件概率
(4)
在已知条件概率的情况下,可以使用最大似然函数来估计参数,也就说在知道y 和x 的情况下,可以估计w是真实样本的最大概率是多少。
(5)
因为求累乘很麻烦,因此转为求对数
(6)
左边转化:
(7)
继续化简
(8)
下一步:
(9)
最终化简为:
(10)
因为L(w)是概率值,所以应该要求这个概率值越大越好,公式右边第一项是常数,没有影响,所以就要求第二项越小越好
因此得到目标函数:
(11)
为了让公式(11)越小越好,因此应该就是求函数的极小值。因为公式(11)是凸函数,因此求极小值就是求导数为0的点
将公式(11)展开
(公式打不上去,就去别去扒了一张图来)
对其求偏导
(12)
(13)
对公式(13)化简整理:
(14)
对矩阵求偏导,最终得到
(15)
求偏导等于0的点因此为
(16)
即
到此求出参数w 与样本之间的关系。
但这里
不一定可逆,因此就涉及到了使用梯度下降的方式来求解。之后写关于梯度下降的博客