正规方程（含推导过程） from 吴恩达的机器学习

最新推荐文章于 2025-04-09 21:06:39 发布

蜗牛专注学习

最新推荐文章于 2025-04-09 21:06:39 发布

阅读量2.7w

点赞数 69

分类专栏：机器学习 from 吴恩达

39 篇文章

订阅专栏

正规方程是通过求解下面的方程来找出使得代价函数最小的参数的：

假设我们的训练集特征矩阵为X(包含了

）并且我们的训练集结果为向量 y，则利用正规方程解出向量:

**********

例：

正规方程推导过程

参考：https://blog.csdn.net/chenlin41204050/article/details/78220280

多变量线性回归代价函数为：

正规方程是通过求解下面的方程来找出使得代价函数最小的参数：

设有m个训练实例，每个实例有n个特征，则训练实例集为：

这里写图片描述
其中表示第i个实例第j个特征。

特征参数为：

这里写图片描述

输出变量为：

这里写图片描述

故代价函数为：

这里写图片描述

进行求导，等价于如下的形式：

这里写图片描述

求导公式：

这里写图片描述

这里写图片描述
该矩阵求导为分母布局下的标量/向量形式：
故有，

这里写图片描述
该矩阵求导为分母布局下的标量/向量形式：
故有：

这里写图片描述
其中为标量，可看成一个常数。
该矩阵求导为分母布局下的标量/向量形式：
故有：

综上，正规方程为：

这里写图片描述

最终可得特征参数的表示：

这里写图片描述

梯度下降与正规方程的比较：

梯度下降	正规方程
需要选择学习率	不需要
需要多次迭代	一次运算得出
当特征数量n大时也能较好适用	需要计算如果特征数量n较大则运算代价大，因为矩阵逆的计算时间复杂度为，通常来说当n小于10000 时还是可以接受的
适用于各种类型的模型	只适用于线性模型，不适合逻辑回归模型等其他模型