机器学习——线性模型

最新推荐文章于 2024-04-28 19:36:50 发布

yyHaker

最新推荐文章于 2024-04-28 19:36:50 发布

阅读量472

点赞数 1

分类专栏：机器学习文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yyHaker/article/details/79826339

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

线性模型

１．线性回归

1.1 问题及定义

线性回归模型是机器学习中的基本算法模型之一，可以用来解决预测房价等问题。如下图所示的一个例子，房子因房子大小、卧室数目、地板数量等不同而有不同的价格，那么给定了房子大小、卧室数目、地板数量我们能否预测出一个房子的价格呢？
房价预测图
我们使用线性回归来解决上述问题。
给定一个 $n$ 个特征的实例 $x$ , $x=(x_1;x_2; x_3;...; x_n)$ , 对于线性回归的假设定义为：

h θ = θ 0 + θ 1 x 1 + θ 2 x 2 + . . . + θ n x n (1)

$h_{\theta} = \theta_{0} + \theta_{1}x_1 + \theta_{2}x_2 + ... + \theta_{n}x_n \tag1$
其中

θ θ $\theta$ 表示参数，

θ={θ0;θ1;θ2;θ3;...;θn} θ = { θ 0 ; θ 1 ; θ 2 ; θ 3 ; . . . ; θ n } $\theta =\{ \theta_0; \theta_1; \theta_2; \theta_3;...;\theta_n\}$ 。为了方便，我们引入

x0=1 x 0 = 1 $x_0=1$ ，从而

x=(x0;x1;x2;x3;...;xn) x = ( x 0 ; x 1 ; x 2 ; x 3 ; . . . ; x n ) $x=(x_0;x_1;x_2; x_3;...;x_n)$ ，然后将上述式子使用向量表示为：

h θ = θ T x (2)

$h_{\theta} = \theta^{T} x \tag2$

我们使用均方误差来作为线性回归的代价函数，
这里写图片描述
其中 $x^{(i)}$ 表示第ｉ个训练实例的特征向量， $y^{(i)}$ 表示第ｉ个训练实例的真实值， $m$ 表示实例的个数。
我们可以通过用很多数据来训练这个模型，得到是代价函数最小的参数 $\theta$ ，然后使用这个模型来预测房价。
这里我介绍两种方法，一种是梯度下降，一种是最小二乘法。

方法一：梯度下降

我们让代价函数对参数 $\theta$ 求导，得到梯度，然后让参数朝着负梯度方向优化， $a$ 表示学习率(learning rate)，优化更新步骤如下：
这里写图片描述
将代价函数代入：

求导后得到：

开始的时候可以随机的选择一系列参数，计算所有的预测结果之后，再更新这(n+1)个参数，如此循环直至收敛！

方法二：最小二乘法

最小二乘法是直接通过使代价函数对于参数 $\theta$ 的导数为０，直接计算出参数 $\theta$ 的值，不过需要满足一定的条件，而且当特征维度很大的时候计算会很慢！
假设 $X=(x^{(1)},x^{(2)},x^{(3)},...,x^{(m)}) \in R^{m \times (n+1)}$ ，实例真实值是 $Y=(y_1, y_2, y_3,...,y_m) \in R^{m}$ ， $ｍ$ 上面说过表示实例的个数，那么使用均值方差的代价函数可以使用向量表示为：

\begin{matrix} (3) & J (θ) = (Y - X θ)^{T} (Y - X θ) \end{matrix}

$J(\theta)=(Y-X\theta)^T(Y-X\theta) \tag3$
对

θ θ $\theta$ 求导得到：

\partial J ( θ ) \partial θ = 2 X T (X θ - Y) (4)

$\frac{\partial J(\theta)}{\partial \theta}=2X^T(X\theta-Y) \tag4$
令

∂J(θ)∂θ=0 ∂ J ( θ ) ∂ θ = 0 $\frac{\partial J(\theta)}{\partial \theta}=0$ 得到：

2 X T (X θ - Y) = 0 X T X θ = X T Y θ = (X T X) - 1 X T Y (5) (6) (7)

$\begin{align} 2X^T(X\theta-Y)=0 \tag5 \\ X^{T}X\theta = X^TY \tag6 \\ \theta = (X^TX)^{-1}X^TY \tag7 \end{align}$
只有当

XTX X T X $X^TX$ 为满秩矩阵或正定矩阵时，即可以求逆矩阵，我们才可以通过上述方法求得参数

θ θ $\theta$ 的值。通过这种方法求得的线性回归模型为：

h θ (x) = ((X T X) - 1 X T Y) T x (8)

$h_{\theta}(x)=((X^TX)^{-1}X^TY)^{T}x \tag8$

1.2 梯度下降和最小二乘法比较

总体来说，梯度下降实用性更强！

梯度下降	最小二乘法
需要选择学习率 $\alpha$	不需要
需要多次迭代	一次运算得出
当特征数量 n 大时也能较好适用	需要计算 $(X^TX)^{-1}$ ,如果特征数量 n 较大则运算代价大,因为矩阵逆的计算时间复杂度为 $O(n^3)$ ,通常来说当 n 小于 10000 时还是可以接受的
适用于各种类型的模型	只适用于线性模型，不适合逻辑回归模型等其他模型

1.3 实现例子

(待补充－－－－)

参考资料：
[1]Andrew course机器学习学习笔记
[2]周志华《机器学习》

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——线性模型

线性模型１．线性回归1.1 问题及定义线性回归模型是机器学习中的基本算法模型之一，可以用来解决预测房价等问题。如下图所示的一个例子，房子因房子大小、卧室数目、地板数量等不同而有不同的价格，那么给定了房子大小、卧室数目、地板数量我们能否预测出一个房子的价格呢？我们使用线性回归来解决上述问题。给定一个nnn个特征的实例xxx, x=(x1;x2;x3;...;xn)x=...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。