目录
一、线性回归
1. 原理推导
1.1 算法概述
给定数据集,,(线性回归的输出空间是整个实数空间),其中是属性维度,是样本数,
线性回归拟合平面
(1)
1.2 误差项分析
预测值和真实值之间存在差异,对于每个样本:
(2)
误差是独立,同分布的,并且服从高斯分布,即:
(3)
将(2)代入(3)中,得到在已知参数和数据的情况下,预测值为的条件概率:
(4)
1.3 似然函数
引入似然函数的目的:根据样本估计参数值,求解什么样的参数根数据组合后恰好是真实值
将(4)连乘得到在已知参数和数据的情况下,预测值为的条件概率,这个条件概率在数值上等于,likelihood(w|x,y),也就是在已知现有数据的条件下,w是真正参数的概率,
似然函数:
(5)
似然函数进行log变换目的:由于乘法难解,通过对数可以将乘法转换为加法,简化计算。
对数似然函数:
(6)
1.4 目标函数推导
对似然函数进行求解,得到目标函数:···
(6)
省去常数部分,得到目标函数: