线性回归与最小二乘

最新推荐文章于 2024-03-20 22:01:31 发布

yichudu

最新推荐文章于 2024-03-20 22:01:31 发布

阅读量787

点赞数

分类专栏：分类与回归文章标签： sklearn 机器学习

天天开心

本文链接：https://blog.csdn.net/chuchus/article/details/72802235

版权

分类与回归专栏收录该内容

11 篇文章 1 订阅

订阅专栏

1.简介

回归是指预测的输出值为连续的实值; 线性是说预测函数是属性的线性组合.
$f(\boldsymbol x)=\boldsymbol w^T\boldsymbol x+b \tag 1$
线性模型(linear model)简单, 易于建模, 但却蕴含着机器学习的重要思想.由于 $\mathbf w$ 直观地表达了各属性在预测中的重要性, 所以线性模型有着很好的可解释性(comprehensibility).

2. 目标函数

均方误差, square loss, 是回归任务中最常用的性能度量. 它有着很好的几何意义, 因为对应的是常用的欧几里得距离.
所以, 用 $w^*,b^* \text {分别表示模型中} w, b的解$ ,则
$(\boldsymbol w^*,b^*)=\arg \min_{\boldsymbol w,b} \sum [y_i- (\boldsymbol w^T\boldsymbol x_i+b)]^2 \tag 2$

3. 求解算法

3.1 最小二乘法

least square method.
基于均方误差最小化进行模型求解的方法称为最小二乘法.

这里为线性最小二乘法, 可求得问题的闭式解, 是 全局最优.
将式(2)做些改动, w由θ表示, b忽略, 同时改写为矩阵形式, 得
$J(\theta)=\frac 12 (X\theta-Y)^T(X\theta-Y)$
where $X\in R^{m*n}, \theta\in R^{n*1},Y\in R^{m*1}$
闭式解为: $\theta^*=(X^TX)^{-1}X^TY$

直观

记 $E_{(w,b)}=\sum_{i=1}^m [y_i- (\boldsymbol w^T\boldsymbol x_i+b)]^2 \tag 3$
先考虑最简单的情形, $\vec x$ 向量只有一维, 那么分别对w和b进行求导(机器学习西瓜版Page-54):
$\nabla_w E(w,b)=2(w\sum_{i=1}^m x_i^2-\sum_{i=1}^m (y_i-b)x_i) \tag {3.1}$
$\nabla_b E(w,b)=2(mb-\sum_{i=1}^m (y_i-w_i)) \tag{3.2}$
然后令(3.1)式与(3.2)式为零可得到w和b最优解的闭式(closed-form)解
$w=\frac{\sum_{i=1}^m y_i(x_i-\bar x)}{\sum_{i=1}^m x_i^2-\frac 1 m(\sum_{i=1}^m x_i)^2} \tag {3.3}$
$b=\frac 1 m \sum_{i=1}^m(y_i-wx_i) \tag{3.4}$