线性回归的数学推导

线性回归是最基础的算法,同时也是其他高级算法的根基,下面就和大家一起进攻基础算法之线性回归。

线性回归模型是用一条曲线去拟合一个或多个自变量 x 与因变量 y 之间关系的模型,那模型的好坏关键在于真实值与预测值之间的差异 

一般表达式

                                             \large \dpi{150} \large h_{\theta }\left ( x \right )=\theta _{0}+\theta _{1}x_{1}+\theta _{2}x_{2}+...+\theta _{n}x_{n}

向量表达式

                                                 

上面表达式得到的是预测值,而预测值与真实值之间的差异用误差 \large \varepsilon 来表示。于是,每一个样本的真实值与预测值之间存在这样的关系:

                                                  

其中\large y^{\left ( i \right )}是真实值,\theta ^{T}x^{\left ( i \right )}是预测值,\large \varepsilon ^{\left ( i \right )}是误差。

误差\large \varepsilon ^{\left ( i \right )}是独立同分布的,并且服从均值为0方差为\large \sigma ^{2}的高斯分布(也称为正态分布)。补充:正态分布的均值和方差取不同值,得到不同的分布图,但均值为0,方差为1的分布称为标准正态分布。

其中,高斯分布表达式为:

                                               \large f\left ( x \right )=\frac{1}{\sqrt{2\pi }\sigma }exp^{\frac{-\left ( \varepsilon _{i} -\mu \right )^{2}}{2\sigma ^{2}}}

由于误差服从均值为0方差为\large \sigma ^{2}的高斯分布,所以满足:

                                                  

于是得到:

                                                   

该式子表示\large \theta\large x^{\left ( i \right )}结合后的值与\large y^{\left ( i \right )}接近的概率,即误差\large \varepsilon ^{\left ( i \right )}最小的概率,即概率越大,说明预测值与真实值越接近。

由于线性回归模型是一条直线(或超平面)拟合多个点,所以需要满足所有误差取得最小值,即所有概率的乘积最大化,符合似然函数:

                   

上式中需要找到\large \theta能使得概率连乘\large L\left ( \theta \right )最大化,也就是预测值与真实值无限接近。

由于连乘难解,所以需要转化成加法,取对数得:

                          

                                                 

上面的式子中,第一项是确定值,而第二项是变动值,所以要使得\large logL\left ( \theta \right )最大,即要使得\large \dpi{80} \large \sum_{i=1}^{m}\left ( y^{\left ( i \right )} -\theta ^{T}x^{\left ( i \right )}\right )^{2}最小化,于是得到损失函数

                          

求损失函数\large J\left ( \theta \right )取得最小值时的\large \theta ,下面利用矩阵求导来进行求解。

目标函数为:

                         

求偏导:

                   

另偏导数为0,得:

                                                       

得到的\large \theta可以使得预测值尽可能接近真实值。

矩阵求导可参考:https://blog.csdn.net/nomadlx53/article/details/50849941

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值