基于Python的机器学习系列（5）：闭式解法

会飞的Anthony

于 2024-08-19 00:30:00 发布

阅读量276

点赞数 3

分类专栏：信息系统机器学习人工智能文章标签： python 机器学习开发语言

本文链接：https://blog.csdn.net/ljd939952281/article/details/141168622

版权

人工智能同时被 3 个专栏收录

80 篇文章 1 订阅

订阅专栏

信息系统

41 篇文章 0 订阅

订阅专栏

机器学习

5 篇文章 0 订阅

订阅专栏

在上一些博文中，我们讨论了如何使用梯度下降法来优化模型参数。然而，梯度下降法虽然强大，但由于它是迭代方法，可能在某些情况下需要较长时间才能收敛。实际上，在某些特殊情况下，我们可以通过直接求解最小化代价函数的解析解来避免迭代计算，这种方法被称为闭式解法或正规方程。

理论背景

闭式解法的推导

在我们的线性回归模型中，假设矩阵 X 的形状为 (m, n)，参数向量 θ 的形状为 (n, )，而目标向量 y 的形状为 (m, )。为了更方便地表示代价函数，我们可以将其写成矩阵的形式，如下所示：

在此基础上，通过一些矩阵微积分的性质，我们可以求得解析解：

为什么不总是使用闭式解法？

尽管闭式解法在某些情况下非常有效，但它并不总是存在或可行的。例如，当代价函数不是凸的或凹的，或者当特征矩阵 $\mathbf{X}$ 的维度非常大时，计算逆矩阵的过程可能会非常耗时。因此，在这些情况下，我们通常更倾向于使用梯度下降法。

代码实现

接下来，我们将实现闭式解法来求解线性回归问题的参数。我们将使用糖尿病数据集作为例子。

1. 准备数据

from sklearn.datasets import load_diabetes
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
import numpy as np

diabetes = load_diabetes()
X = diabetes.data
y = diabetes.target
m = X.shape[0]  # 样本数量
n = X.shape[1]  # 特征数量

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test  = scaler.transform(X_test)

# 添加截距项
intercept = np.ones((X_train.shape[0], 1))
X_train   = np.concatenate((intercept, X_train), axis=1)
intercept = np.ones((X_test.shape[0], 1))
X_test    = np.concatenate((intercept, X_test), axis=1)

2. 使用闭式解法求解参数

from numpy.linalg import inv

def closed_form(X, y):
    return inv(X.T @ X) @ X.T @ y

# 使用闭式解法求解theta
theta = closed_form(X_train, y_train)
print("模型参数:", theta)

3. 计算误差

# 使用模型进行预测
yhat = X_test @ theta

# 确保预测值和实际值形状相同
assert y_test.shape == yhat.shape

# 计算均方误差
mse = ((y_test - yhat)**2).sum() / X_test.shape[0]
print("均方误差: ", mse)

结语

通过本文，我们了解了如何使用闭式解法来求解线性回归模型的参数。尽管闭式解法在某些情况下非常高效，但并不是总能应用于所有问题。在高维数据或复杂模型中，梯度下降法仍然是更为常见的选择。

在接下来的博文中，我们将探讨机器学习分类方法。

敬请期待下一篇博文：基于Python的机器学习系列（6）：二元逻辑回归。

如果你觉得这篇博文对你有帮助，请点赞、收藏、关注我，并且可以打赏支持我！

欢迎关注我的后续博文，我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。

谢谢大家的支持！

会飞的Anthony

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于Python的机器学习系列（5）：闭式解法

通过本文，我们了解了如何使用闭式解法来求解线性回归模型的参数。尽管闭式解法在某些情况下非常高效，但并不是总能应用于所有问题。在高维数据或复杂模型中，梯度下降法仍然是更为常见的选择。在接下来的博文中，我们将探讨机器学习分类方法。敬请期待下一篇博文：基于Python的机器学习系列（6）：二元逻辑回归。欢迎关注我的后续博文，我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。
复制链接

扫一扫