机器学习（五）线性回归之梯度下降法 VS 标准方程法

最新推荐文章于 2020-09-16 23:03:05 发布

Mekeater

最新推荐文章于 2020-09-16 23:03:05 发布

阅读量483

点赞数 1

分类专栏：机器学习文章标签：机器学习梯度下降法标准方程法线性回归

本文链接：https://blog.csdn.net/qq_34720818/article/details/103624868

版权

机器学习专栏收录该内容

31 篇文章 18 订阅

订阅专栏

线性回归之梯度下降法 VS 标准方程法

引言：
假设代价函数J(θ)=aθ²+bθ+c （θ∈R）
那么使得代价函数最小，可以通过求解J(θ)的导数，并令其为0，来求的θ的值，即：
在这里插入图片描述
通过这种方法就可以不使用梯度下降而求得假设函数的参数θ

一、标准方程法求解假设函数参数θ
对于一个有n个特征要素，m个训练样本数据的问题，使用标准方程法如下：
m个样本数据：(x⁽¹⁾,y⁽¹⁾),(x⁽²⁾,y⁽²⁾),…,(x^(m),y^(m))
其中x⁽ⁱ⁾ = [x₀⁽ⁱ⁾;x₁⁽ⁱ⁾;…;x_n⁽ⁱ⁾;] ∈Rⁿ⁺¹；（xⁱ为n+1维列向量），其中x₀⁽ⁱ⁾ = 1
令X = [(x⁽¹⁾)^T;(x⁽²⁾)^T;…;(x^(m))^T] （X为m行n+!列矩阵）
则θ = (X^TX)^-1X^Ty; (θ为n+1维列向量)

举例
例如预测房价与房子大小以及卧室个数、楼层个数、房龄之间关系的训练样本，如下表

x₀	size(x₁)	bed room num(x₂)	floors num (x₃)	age of home (x₄)	==price(y) ==
1	2104	5	1	45	460
1	1416	3	2	40	232
1	1534	3	2	30	315
1	834	2	1	30	178

在这里插入图片描述

θ = (X^TX)^-1X^Ty; (θ为n+1维列向量)

二、梯度下降法 VS 标准方程法

优缺点	梯度下降法	标准方程法
.	需要选择学习速率α	不需要选择学习速率α
.	需要多次迭代	不需要多次迭代
.	即使n很大，也能很好的工作	当n很大，因为需要计算（X^TX）^-1,会计算的非常慢