机器学习之 python实现正规方程

学习溢出

已于 2022-11-11 00:43:18 修改

阅读量896

点赞数 1

分类专栏： Machine Learning 文章标签： python 人工智能

于 2022-11-11 00:42:46 首次发布

本文链接：https://blog.csdn.net/qq_41608408/article/details/127798822

版权

Machine Learning 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

本文介绍了如何利用正规方程求解线性回归模型中的参数θ。正规方程提供了一种直接计算最优θ的方法，无需选择学习率和进行迭代。然而，当存在特征冗余或样本不足时，正规方程可能不可用。此外，当特征数量较大时，计算（XTX）^-1可能会变得效率低下。Python代码示例展示了如何用numpy库实现正规方程求解线性回归。

摘要由CSDN通过智能技术生成

Normal Equations (正规方程)

书接上文，想要计算代价函数中 $\theta$ 的值，可以用正规方程的方法来解。这里推导过程就不展开了，有兴趣的可以移步正规方程推导。

这里直接给出公式:

$\theta = (X^TX)^{-1}X^Ty$

从公式可以看出，相较于梯度下降法，正规方程不需要选择学习率，不需要迭代计算 $\theta$ ，甚至不需要特征缩放。

在给出python代码前，强调一下正规方程的适用范围。

当模型有冗余特征（特征线性相关）或特征过多，样本过少时，项 $X^TX)^{-1}$ 会不可逆，既无法计算。（可以用筛选样本，正则化的方法解决这个问题）
因为需要计算 $X^TX)^{-1}$ ，当特征很多的时候算法会很慢。（根据吴恩达老师的说法，现代的电脑都可以处理1000个特征以下的简单模型没什么压力，除非你的模型非常复杂。如果特征过多或模型过于复杂，可以使用梯度下降法）

Python 实现代码如下：

# 正规方程

import matplotlib.pyplot as plt
import numpy as np
# P = np.loadtxt("PV.csv", delimiter=",")


# y = 3x - 2k + 7z - 3
# X = np.array([[1,1,1,1],[2,1,2,1],[3,0,1,1],[0,1,2,1]])
# Y = np.array([[5],[15],[13],[9]])

# y = 2x + 4k + 7

# X = np.array([[1,1,1],[2,3,1],[4,2,1],[3,3,1],[2,2,1]])
# Y = np.array([[13],[23],[23],[25],[19]])


# y = -13 x + 9
X = np.array([[1,1],[0,1],[-1,1],[2,1]])
Y = np.array([[-4],[9],[22],[-17]])


theta = np.linalg.inv(X.T@X)@X.T@Y
print (theta)

以上。

学习溢出

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习之 python实现正规方程

的值，可以用正规方程的方法来解。这里推导过程就不展开了，有兴趣的可以移步。从公式可以看出，相较于梯度下降法，正规方程不需要选择学习率，不需要迭代计算。在给出python代码前，强调一下正规方程的适用范围。书接上文，想要计算代价函数中。，甚至不需要特征缩放。
复制链接

扫一扫