机器学习-线性回归

最新推荐文章于 2020-09-11 22:53:32 发布

burpee

最新推荐文章于 2020-09-11 22:53:32 发布

阅读量434

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1、Linear Regression

可以说基本上是机器学习中最简单的模型了，但是实际上其地位很重要（计算简单、效果不错，在很多其他算法中也可以看到用LR作为一部分）。

先来看一个小例子，给一个“线性回归是什么”的概念。图来自[2]。

这里写图片描述
假设有一个房屋销售的数据如下：
面积(m^2) 销售价钱（万元）
123 250
150 320
87 160
102 220
… …

当我们有很多组这样的数据，这些就是训练数据，我们希望学习一个模型，当新来一个面积数据时，可以自动预测出销售价格（也就是上右图中的绿线）；这样的模型必然有很多，其中最简单最朴素的方法就是线性回归，也就是我们希望学习到一个线性模型（上右图中的红线）。不过说是线性回归，学出来的不一定是一条直线，只有在变量x是一维的时候才是直线，高维的时候是超平面。

线性回归的目标是用预测结果尽可能地拟合目标label，用最常见的Least square作为loss function：

J(w)=1n∑i=1n(yi−f(xi))2=1n∥y−Xw∥2

定义一下一些符号表达，我们通常习惯用X=(x1,x2,...,xn)T∈Rn×p表示数据矩阵，其中xi∈Rp表示一个p维度长的数据样本；y=(y1,y2,...,yn)T∈Rn

表示数据的label，这里只考虑每个样本一类的情况。

线性回归的模型是这样的，对于一个样本xi

，它的输出值是其特征的线性组合：

f (x i) = \sum m = 1 p w m x i m + w 0 = w T x i

其中，w0称为截距，或者bias，上式中通过增加xi0=1把w0也吸收到向量表达中了，简化了形式，因此实际上xi有p+1维度。

从下图来直观理解一下线性回归优化的目标——图中线段距离（平方）的平均值，也就是最小化到分割面的距离和。
这里写图片描述

也就是很多中文教材中提到的最小二乘；线性回归是convex的目标函数，并且有解析解：

w^= (X T X) - 1 X T y

线性回归到这里就训练完成了，对每一个样本点的预测值是 f(xi)=yi^=w^Txi。所以：

y^= X w^= X (X T X) - 1 X T y

接下来看一下我们寻找到的预测值的一个几何解释：从上面的解析解w^=(XTX)−1XTy

可以得到 XT(y^−y)=0（垂直的向量相乘=0），因此实际上 y^是 y在平面 X（由列向量 x1和 x2

张成，假设只有两维）上的投影。
预测值的直观解释

ok，一般介绍线性回归的文章到这里也就结束了，因为实际使用中基本就是用到上面的结果，解析解计算简单而且是最优解；当然如果求逆不好求的话就可以不用解析解，而是通过梯度下降等优化方法来求最优解，梯度下降的内容不在本篇中，后面讲逻辑回归会说到。也可以看我前面写的今天开始学PRML第5章中有写到，或者直接翻阅wikipedia:gradient descent。

不过在这里我再稍微提几个相关的分析，可以参考ESL[3]的第3章中的内容。前面我们对数据本身的分布是没有任何假设的，本节下面一小段我们假设观察值yi

都是不相关的，并且方差都是 σ2

，并且样本点是已知（且是中心化过了的，均值为0）的。于是我们可以推出协方差矩阵

V a r (β^) = (X T X) - 1 σ 2

证明：

V a r (β^) = (X T X) - 1 X T y y t X (X T X) - 1 = (X T X) - 1 σ 2

要估计方差σ2

，可以用

σ^2 = 1 n - p - 1 \sum i = 1 n (y i - y^i) 2

这里和一般的方差的形式看起来不同，分母是 n−p−1而不是 n，是因为这样的估计才是 σ2的无偏估计。
证明：

E (σ^2) = E (1 n - p - 1 \sum n i = 1 (y i - y^i) 2) = E (1 n - p - 1 [y - X (X T X) - 1 X T y] T [y - X (X T X) - 1 X T y] ） = E (1 n - p - 1 y T [I n - X (X T X) - 1 X T] y ） = n σ 2 n - p - 1 - 1 n - p - 1 tr (X (X T X) - 1 X T y y T) = n σ 2 n - p - 1 - σ 2 n - p - 1 tr (X (X T X) - 1 X T) = n σ 2 n - p - 1 - ( p + 1 ) σ 2 n - p - 1 = σ 2

好，第一篇就写到这里。这个系列是从0开始的基础复习记录，力求清晰易懂。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习-线性回归

1、Linear Regression可以说基本上是机器学习中最简单的模型了，但是实际上其地位很重要（计算简单、效果不错，在很多其他算法中也可以看到用LR作为一部分）。先来看一个小例子，给一个“线性回归是什么”的概念。图来自[2]。假设有一个房屋销售的数据如下：面积(m^2) 销售价钱（万元） 123 250 150 320 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。