3. 线性回归 Linear Regression

最新推荐文章于 2024-01-04 00:03:22 发布

n不正

最新推荐文章于 2024-01-04 00:03:22 发布

阅读量620

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_30981697/article/details/71439000

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

3. 线性回归 Linear Regression

pdf版本下载地址：https://pan.baidu.com/s/1geJNGiB
html版本下载地址：https://pan.baidu.com/s/1nu6Kn4d

这一节介绍线性回归LinearRegression的原理以及它的推导过程。简单的从数学原理角度分析一下，并不是统计学角度。因此在一些公式里面会忽略误差项。另外对于统计学里面的t检验，F检验，显著性之类的也一概不论。

1 基本形式

线性回归作为回归（Regression）里面最基本的一种算法，应用很多，比如预测明天的股票价格，广告点击率的预测，做推荐算法等等。当然了，线性回归不一定做的好……

首先给定一批训练数据： $D = \{(x_i, y_i)\}_i^N$

我们试图从这些训练数据当中学习到一个预测函数： $f(x) = w^Tx+b$ ，使得通过这个模型预测得到的数值尽可能的接近 $y$ 。

那么这里的 $w$ 和 $b$ 如何确定呢？

2 原理推导

定义平方误差为我们的损失函数（最小二乘法）：L(f)=L(w,b)=∑i=1N(yi−(w⋅xi+b))2
- 很显然： $w^*,b^* = \mathop{argmin}\limits_{w, b} \sum\limits_{i = 1}^{N}(y_i - (w\cdot x_i+b))^2$
  那么 $w^*,b^*$ 如何计算呢？
- 梯度下降（Gradient Descent）！
  首先计算梯度：
  
  $\nabla L=\left[ \begin{matrix} \frac{\partial L}{\partial w}\\ \frac{\partial L}{\partial b} \end{matrix} \right] = \left[ \begin{matrix} \sum_{i=1}^n2(y_i-(b+wx_i))(-x_i)\\ \sum_{i=1}^n2(y_i-(b+wx_i))(-1) \end{matrix} \right]$
  
  然后得到解：
  
  $⎧ ⎩ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ w = \sum i = 1 N y i ( x i - x ¯ ) \sum i = 1 N x 2 i - 1 m ( \sum i = 1 N x i ) 2 b = 1 m \sum i = 1 N (y i - w x i)$ $\begin{cases} w = \frac{\sum\limits_{i=1}^{N}y_i(x_i-\bar x)}{\sum\limits_{i=1}^{N}x_i^2-\frac{1}{m}(\sum\limits_{i=1}^{N}x_i)^2}\\ b = \frac{1}{m}\sum\limits_{i=1}^{N}(y_i-wx_i) \end{cases}$
- 3 更一般的形式
  
  将 $b$ 组合到 $w$ 上，得到 $\hat w = [w, b]$ 。并且将数据集、标签值都表示成矩阵形式，那么：
  - $\hat w^* = \mathop{argmin}\limits_{\hat w} (y - X\hat w)^T(y-X\hat w)$
  - 同样地，对其求导，当 $X^TX$ 非奇异时：
    $\hat w^* = (X^TX)^{-1}X^Ty$
  - 然而， $X^TX$ 不一定满秩，这个时候会出现多个解。这个时候取哪一个解需要一些其他的规则。
  - XTX 不可逆的解决办法：
    - 删除掉一些冗余的特征，使得 $X^TX$ 可逆
    - 加入正则化项，成为lasso回归或岭回归
  4 简单的推广
  
  除了以上的简单形式，线性回归还有一些变体。比如说对数线性回归，就是把 $y$ 值取一个对数然后做线性回归。还有的会对特征 $x$ 做一个转换，比如说把二维空间中的特征转化到五维空间中再做线性回归。但这些方法本质上还是线性回归。我们把他们统称为广义线性模型（Generalized Linear Model）。有以下的形式：
  - $g(y) = w^Tx+b$
  - $y = w^Tg(x)+b$

n不正

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
3. 线性回归 Linear Regression

3. 线性回归 Linear Regressionpdf版本下载地址：https://pan.baidu.com/s/1geJNGiBhtml版本下载地址：https://pan.baidu.com/s/1nu6Kn4d 这一节介绍线性回归LinearRegression的原理以及它的推导过程。简单的从数学原理角度分析一下，并不是统计学角度。因此在一些公式里面会忽略误差项。另外对于统计学里面
复制链接

扫一扫