最小二乘法的矩阵推导

MV Engineer

于 2023-07-24 16:00:42 发布

阅读量209

点赞数

文章标签：最小二乘法矩阵算法机器学习线性回归

本文链接：https://blog.csdn.net/weixin_45530612/article/details/131895404

版权

最小二乘法的矩阵推导

在一个线性回归模型中，假设：
$y$ 为一个 n × 1 的目标向量；
$X$ 为一个n × p的特征变量矩阵；
$β$ 为一个 p × 1 的待估参数向量；
$ε$ 为一个 n × 1 的误差向量;
则线性回归模型可以表示为：
$y = Xβ + ε$
其中，ε为误差向量。
我们的目标是找到一个向量 $β$ ，使得模型的预测值 $Xβ$ 与真实值 $y$ 的差异最小。即最小化误差向量的平方和。误差向量的平方和为：
$S = ε^Tε=(y - Xβ)^T(y - Xβ)$
为了找到使误差最小的β，我们对S进行最小化求解,由于是求最小值，对β求导并令导数为零：
$\begin{align} ∂S/∂β &=\frac{∂(y - Xβ)^T (y - Xβ) }{∂β}\\ &=\frac{∂(y^T - β^T X^T)(y - Xβ)}{∂β}\\ &=\frac{∂(y^T y - y^T Xβ - β^T X^T y + β^T X^T X β)}{∂β}\\ &=\frac{∂(y^T y - 2β^T X^T y + β^T X^T X β)}{∂β}\\ &=2XᵀY + 2XᵀXβ\\ &=0\\ \end{align}$
则： $β = (X^{T} X)^{- 1} X^{T} Y$

c++实现如下：

#include <iostream>
#include <Eigen/Dense> // 使用Eigen库进行矩阵计算

const int M = 5; // 样本数量
const int N = 2; // 变量数量

void leastSquares(const Eigen::MatrixXd& X, const Eigen::VectorXd& y, Eigen::VectorXd& coefficients) {
    Eigen::MatrixXd X_t = X.transpose(); // X'的转置
    Eigen::MatrixXd X_t_X = X_t * X; // X'^T * X'
    Eigen::MatrixXd X_t_X_inv = X_t_X.inverse(); // (X'^T * X')^(-1)
    Eigen::MatrixXd X_t_y = X_t * y; // X'^T * y

    coefficients = X_t_X_inv * X_t_y; // (X'^T * X')^(-1) * X'^T * y
}

int main() {
    // 输入矩阵X
    Eigen::MatrixXd X(M, N);
    X << 1, 2,3, 4, 5, 6,7, 8,9, 10;

    // 输出向量y
    Eigen::VectorXd y(M);
    y << 3,6,8,11,14;

    // 构建设计矩阵X'
    Eigen::MatrixXd X_prime(M, N + 1);
    X_prime << Eigen::MatrixXd::Ones(M, 1), X;

    // 最小二乘法求解
    Eigen::VectorXd coefficients(N + 1);
    leastSquares(X_prime, y, coefficients);
    
    std::cout << "Coefficients: " << std::endl;
    std::cout << coefficients << std::endl;
    return 0;
}