多元线性回归损失函数求导过程 均方误差推导过程 最小二乘法推导

1. 方程2-8:
           L = y^T y - y^T X \hat{w} - \hat{w}^T X^T y + \hat{w}^T X^T X \hat{w}

2. 对方程2-8关于 \hat{w} 求导:
           \frac{\partial L}{\partial \hat{w}} = \frac{\partial y^T y}{\partial \hat{w}} - \frac{\partial y^T X \hat{w}}{\partial \hat{w}} - \frac{\partial \hat{w}^T X^T y}{\partial \hat{w}} + \frac{\partial \hat{w}^T X^T X \hat{w}}{\partial \hat{w}}

3. 分别求导:

  •     \frac{\partial y^T y}{\partial \hat{w}} = 0,因为 y^T y 与 \hat{w} 无关。
  •     \frac{\partial y^T X \hat{w}}{\partial \hat{w}} = y^T X,根据矩阵微分公式 \frac{\partial a^T x}{\partial x} = a
  •     \frac{\partial \hat{w}^T X^T y}{\partial \hat{w}} = X^T y,根据矩阵微分公式 \frac{\partial x^T a}{\partial x} = a
  •     \frac{\partial \hat{w}^T X^T X \hat{w}}{\partial \hat{w}} = 2 X^T X \hat{w},根据矩阵微分公式 \frac{\partial x^T A x}{\partial x} = (A + A^T) x,这里 A = X^T X 是对称矩阵,所以 A + A^T = 2A

4. 将求导结果代入:
           \frac{\partial L}{\partial \hat{w}} = 0 - y^T X - X^T y + 2 X^T X \hat{w}

            说明:矩阵乘法和向量的内积(点乘)是可交换的,所以:y^T X = X^T y

5. 整理得到公式2-13:
           \frac{\partial L}{\partial \hat{w}} = - X^T y - X^T y + 2 X^T X \hat{w}

           简化:

                \frac{\partial L}{\partial \hat{w}} = -2 X^T y + 2 X^T X \hat{w}

                \frac{\partial L}{\partial \hat{w}} = 2(X^T X \hat{w} - X^T y)

6. X^T X为满秩矩阵或者正定矩阵设置偏导数等于0来找到最小化损失函数的 \hat{w} :

        \hat{w} = (X^T X)^{-1} X^T y

        这是线性回归中最常见的正规方程。

7. 矩阵 X^T X 不是满秩矩阵时

它可能不可逆,从而导致参数 \hat{w} 无法直接求解。通过添加正则化项 \lambda I,可以确保 X^T X + \lambda I 是满秩的,从而保证矩阵的可逆性。

        \hat{w}^* = (X^T X + \lambda I)^{-1} X^T y

        正则化项 \lambda I 中的 \lambda 是一个正数, I 是单位矩阵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值